决策树在Rapidminer中使用了什么算法?

johnny5550822johnny5550822 成员职位:12贡献我
2019年6月编辑 帮助
你好,

Rapidminer使用了什么样的决策树算法?它能处理不平衡的数据吗?

谢谢!
约翰尼
标记:

答案

  • 远期远期 成员职位:93因素二世
    如果你有严重不平衡的数据,不要使用决策树。
    一般来说,使用决策树探索数据是一个好主意,可以应用模型
    不总是看不见的数据。
    你可以使用操作符“Sample (Bootstrapping)”来预处理你的数据。
    但是您应该在测试步骤中关闭预处理。
    有关更多文档,请参阅决策树操作符的文档。
  • johnny5550822johnny5550822 成员职位:12贡献我
    谢谢你的回复。因为我知道有算法解决了不平衡问题(对于决策树),我不确定决策树在rapidminer中使用的版本。比如C4.5或者其他什么?
  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    你好,

    我不确定RapidMiner决策树使用的是哪种实现,我想类似于C4.5。如果你想确保使用C4.5,你可以从Weka扩展中使用W-J48。该操作符是C4.5的自由实现。

    最好的问候,
    马吕斯
  • johnny5550822johnny5550822 成员职位:12贡献我
    太好了,非常感谢!
  • fmonfmon 成员职位:7贡献我
    我想基于您在决策树操作符的参数设置中使用的标准,RM使用不同的算法(如c4.5)生成不同的树。
    我说的对吗?
    如果有人有任何信息,请在这里分享。
    谢谢
  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    你好,

    无论选择哪种标准,算法都是相同的。只有在每个节点中,根据参数设置,使用不同的方法选择用于分割的“最佳”属性。

    最好的问候,
    马吕斯
  • fmonfmon 成员职位:7贡献我
    你好,
    谢谢你的回答。
    那么谁知道“决策树”算子用来生成决策树的算法是什么呢?
    BAYANY2016
  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    就像我说的,它类似于C4.5。在每个节点中,通过迭代所有属性来选择split属性,根据分割标准为每个属性找到最佳分割,然后使用使所选标准最大化的属性。

    对于名义属性,总是为每个值创建一个分支。对于数字/日期属性,总是执行二进制分割。为了找到最好的分割值,在训练数据中尝试所有可能的值。

    重复这个过程,直到你有纯净的叶子或满足一个预修剪条件。然后选择性地应用一些后修剪。

    最好的问候,
    马吕斯
    BAYANY2016
  • fmonfmon 成员职位:7贡献我
    谢谢,
    我想确认一下!
登录注册置评。