为什么RapidMiner在应用自动特征选择时删除数据行?
最佳答案
-
lionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年
独角兽
嗨@SanderMEs,
不,这不是一个愚蠢的问题。
autommodel将你的数据集分成两部分:
- 60%的数据用于训练模型
-40%数据的一部分用于测试模型(它是一个保留集)。
然后在你的测试集上,从你的测试集中删除2/7的数据。
您的输出数据是预测和相关的混淆矩阵,并基于此最终结果测试集,这就是为什么你的输出文件应该代表4500行(15577 x 40% x 5/7行)
问候,
莱昂内尔6