是否有可能循环一组模型并获得一组预测?
我正在尝试实现Tom Fawcett在"从不平衡的班级中学习".
我总结了算法:
1)从原始不平衡数据集中获取bootstrap样本
2)通过下采样来平衡每个样本
3)评估模型(如树)
4)让一棵棵树投票
我正试图在Rapidminer中实现算法。我使用集合。我可以成功地创建一个模型集合,但是当我试图循环这个集合来生成另一个预测集合时,我遇到了麻烦。我是否违反了处理集合的规则?
我以鲍鱼的数据集为例。我已经附上了文件。
任何帮助都将不胜感激。
< ?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.5.003”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
<过程扩展= " true " >
<列出关键= " filters_list " >
< / >列表
< /操作符>
<列出关键= " additional_macros " / >
< /操作符>
<列出关键= " filters_list " >
< / >列表
< /操作符>
<列出关键= " sample_size_per_class " / >
<列出关键= " sample_ratio_per_class " / >
<列出关键= " sample_probability_per_class " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
<过程扩展= " true " >
< /操作符>
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程
< /操作符>
> < /过程
标记:
0
答案
忘记附加训练集了。
嘿,
难道你不能使用bagging操作符并平衡里面的类(例如使用Generate Weight (Stratification))吗?
最好的
马丁
德国多特蒙德
或者,当您创建原始模型时,不要将它们存储在集合中,而是作为存储库中单独的模型存储。然后,您可以简单地使用“Vote”集合操作符或类似操作符来获得最终预测。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询