如何知道是否要进行任何预处理?

201202010201202010 成员职位:1新手
2018年11月编辑 帮助
在使用随机森林时,我们是否需要进行预处理?
标记:

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    你好,
    嗯. .简短的回答是:不。

    随机森林最酷的事情之一是,它们基本上可以处理所有类型的数据,并且还具有一些“内置特征选择”。因此,你可以把数据扔进去,得到合理的结果。唯一的例外是日期属性,你应该对其进行预处理(例如星期几)。

    现在,更长的答案是:正确的预处理可以得到更好的结果。虽然随机森林是简单的算法,但你仍然可以做一些事情。一个问题可能是生成特性以绕过xor问题。用于自动生成特性的新Auto-Model特性(这是9.1 (Beta)的一部分)可以在这里提供帮助。

    BR,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • rfuentealbarfuentealba 主持人,RapidMiner认证分析师,会员,大学教授职位:568独角兽
    @201202010

    我同意@mschmitz你不必这么做。尽管如此,我只会将我想要使用的特征传递给我的算法,并删除相关的属性。
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    此外,如果你不一定要使用随机森林,那么其他算法将受益于预处理或需要预处理。因此,将其作为EDA的一部分执行是一个很有帮助的步骤,特别是在处理缺失、异常值等方面。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
登录注册置评。