看起来你是新来的。登录或注册开始。
我们的数据集有超过100000条记录,我将样本大小减少到30000如果我进一步减少数据集,比如3000,那么样本表示对于模型训练来说太小了。
我试过在Python中运行完整的数据集,应用2-3种不同的算法,它成功地给了我结果。当我在python上运行离群值检测模型时,它不会出现内存不足的问题,但在数据集相对较小的Rapid Miner中,它也会内存不足。为什么autommodel -Outlier Detection在相对中等规模的数据集上失败?
答案
我们的数据集有超过100000条记录,我将样本大小减少到30000如果我进一步减少数据集,比如3000,那么样本表示对于模型训练来说太小了。
我试过在Python中运行完整的数据集,应用2-3种不同的算法,它成功地给了我结果。当我在python上运行离群值检测模型时,它不会出现内存不足的问题,但在数据集相对较小的Rapid Miner中,它也会内存不足。为什么autommodel -Outlier Detection在相对中等规模的数据集上失败?