优化网格随机森林-不工作。

CarlNCarlN 成员职位:6因素二世
RapidMiner独角兽,

我试图运行一个优化网格与我们的随机森林模型,我得到一个错误。说明gain_ratio标准不能用于数字标签(见下图)。我检查了所有参数,我没有在优化网格中使用gain_ratio(见下图)。所以,具体来说,你是如何在RapidMiner中使用具有交叉验证的优化网格和随机森林来预测一个实数的?

你能发送一个基本的工作示例的工作流程,并与良好的文档注释解释每一步。



答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3286年RM数据科学家
    你好,
    你能给我们展示一下你的优化设置吗?你可能会用最小二乘。

    另外:要小心在X-Val中使用Explain Pred。这可能会花费大量的时间。

    BR,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • CarlNCarlN 成员职位:6因素二世
    请参阅下文。此外,我将优化的结果发送到日志。让我知道这个问题是什么,或者在RapidMiner中如何工作的示例工作流过程。




  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3286年RM数据科学家
    你好,
    您有一个数字标签,并尝试在[information_gain,gain_ratio,gini_index,accuracy]之间改变增益度量。这是行不通的,因为这些指标在数字标签上不起作用。

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • CarlNCarlN 成员职位:6因素二世
    好的,谢谢你的解释,但是从你的回答来看,解决方案并不明确。

    具体来说,需要哪些配置/设置任务才能使网格优化算子工作并简单地找到随机森林模型的最佳参数?你有一个如何工作的示例工作流吗?
  • CarlNCarlN 成员职位:6因素二世
    好的,谢谢你的解释,但是从你的回答来看,解决方案并不明确。

    具体来说,需要哪些配置/设置任务才能使网格优化算子工作并简单地找到随机森林模型的最佳参数?你有一个如何工作的示例工作流吗?
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:829独角兽
    嗨!

    只需选择正确和适用的设置进行优化。保留标准(对于数值预测,它必须是least_square),并优化树的数量和最大深度等参数。

    问候,
    Balazs
  • CarlNCarlN 成员职位:6因素二世
    我在随机森林决策树中使用了最小二乘,但它仍然会给我一个错误(见下文)。我还是不明白为什么没用。请告诉我具体的,一步一步的,操作指南让它工作。非常感谢。


登录注册置评。