两个算法

ebaybekebaybek 成员职位:1贡献我
2018年11月编辑 帮助

嗨大师,

你得帮帮我。我们有一个CART(分类和回归树)(Twoing算法或基尼算法)的项目。但是ıf我们可以在RapidMiner Studion中查找两个算法,但一无所获。哪种算法对他们来说是最好的。

我们认为最好的方法是回归分类或“分类与决策树”。你能推荐一款或其他的吗

提前感谢

致以最亲切的问候

es Baybek

标记:

答案

  • yyhuangyyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:363RM数据科学家

    我们有决策树随机树CART的操作员。

    当您根据一些分裂标准或杂质测量来种植树时,您可以选择

    • information_gain:计算所有属性的熵值。选择熵最小的属性进行拆分。这种方法倾向于选择具有大量值的属性。
    • gain_ratio:它是信息增益的一个变体。它调整每个属性的信息增益,以允许属性值的宽度和一致性。
    • gini_index:这是一个ExampleSet的杂质度量。对所选属性进行拆分会降低结果子集的平均基尼指数。
    • accuracy:选择这样的属性进行分割,使整个树的准确性最大化。

    根据IBM的定义ftp://public.dhe.ibm.com/software/analytics/spss/support/Stats/Docs/Statistics/Algorithms/13.0/TREE-CART.pdf

    当示例中的类数C=2时,2等于通常的杂质索引。快速查看经典R库RPART (递归划分和回归树,而两个都不是RPART的一部分。但这篇论文是关于rpartOrdinal的

    在R中提供了两个选项。http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2899711/

    你可能知道,在rapidminer中集成R代码是很容易的。

    希望这对你有帮助。

    Thomas_Ott
登录注册置评。