是否有可能循环一组模型并获得一组预测?

earmijoearmijo 成员职位:265独角兽
2020年3月编辑 帮助

我正在尝试实现Tom Fawcett在"从不平衡的班级中学习".

我总结了算法:

1)从原始不平衡数据集中获取bootstrap样本

2)通过下采样来平衡每个样本

3)评估模型(如树)

4)让一棵棵树投票

我正试图在Rapidminer中实现算法。我使用集合。我可以成功地创建一个模型集合,但是当我试图循环这个集合来生成另一个预测集合时,我遇到了麻烦。我是否违反了处理集合的规则?

我以鲍鱼的数据集为例。我已经附上了文件。

任何帮助都将不胜感激。

< ?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.5.003”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文

<过程扩展= " true " >


< /操作符>


<过程扩展= " true " >


<列出关键= " filters_list " >

< / >列表
< /操作符>


<列出关键= " additional_macros " / >
< /操作符>

<列出关键= " filters_list " >

< / >列表
< /操作符>


<列出关键= " sample_size_per_class " / >
<列出关键= " sample_ratio_per_class " / >
<列出关键= " sample_probability_per_class " / >
< /操作符>





< /操作符>













> < /过程
< /操作符>




<过程扩展= " true " >


< /操作符>


< /操作符>

<列出关键= " application_parameters " / >
< /操作符>




< /操作符>








> < /过程
< /操作符>







> < /过程
< /操作符>
> < /过程
标记:

答案

  • earmijoearmijo 成员职位:265独角兽

    忘记附加训练集了。

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3314年RM数据科学家

    嘿,

    难道你不能使用bagging操作符并平衡里面的类(例如使用Generate Weight (Stratification))吗?

    最好的

    马丁

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    SGolbert
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽

    或者,当您创建原始模型时,不要将它们存储在集合中,而是作为存储库中单独的模型存储。然后,您可以简单地使用“Vote”集合操作符或类似操作符来获得最终预测。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
登录注册置评。