在做决策树之前如何减少变量?
最好的答案
-
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:911独角兽嗨!
基于决策树的方法都是关于选择相关属性的。如果您之前删除了属性,那么树就会发生变化,这些属性将是相关的,您的树可能会变得更糟。如果树没有改变,则删除实际上找到了不相关的属性,但无论如何,这都是通过决策树的情况。
对你的属性进行评估并检查它们是否有有害的东西,比如“未来的”知识泄漏到模型中,或者很难获得数据,或者属性有许多缺失值,这是一个好主意。您可以手动删除这些。但是,在使用任何选择或权重属性本身的方法之前,您不应该基于“我认为这些属性不相关”而删除属性。这将是“部分人类,部分机器学习”,很难从这个过程中获得比为这个任务编写的算法更好的结果。
如果您的决策树很难解释,并且可解释性是比准确性更重要的目标,那么最好将修剪参数更改为更严格的值。这将为您提供一个更小、更容易理解的树,而不会在应用之前牺牲相关属性。
问候,
Balazs1 -
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:911独角兽
答案