将预测模型应用于数值

akseleratorakselerator 成员职位:3.学我
2021年4月编辑 帮助
Hi Rapid Miner社区
新来的,这是我的第一个问题。希望能加入这个很棒的社区!
我正试图进一步预测/了解我的工作中成本上升的原因。我的问题有点像泰坦尼克号的预测练习。
现在来看问题:
我有一个数据集,包含我公司运输投资组合的分类成本超支(比如运输大型船只)和相关变量,这些变量可以解释为什么会发生这些超支(POD/POL/目的地/类型/规模等)。问题是,它不是Cost overflow =Yes/No,而是代表溢出的大小/严重性的数值,我无法理解如何创建一个考虑到这一点的预测模型。此外,我希望得到一个输出,解释为什么模型预测它所做的,这样我就可以确保消除这些错误。
感谢所有花时间帮助我的人!

编辑:我现在只有大约65个项目的数据。其目的是构建它,并在项目完成时不断向它提供信息。不能再往前追溯了。这意味着autommodel不能工作。

亲切的问候
Aksel

最佳答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    解决方案接受
    你好,
    你可以做几件事:
    • 您可以构建一个回归问题并预测溢出的数量。
    • 你可以做一个分类问题,然后定义一个自己的性能指标为平均\sum OverRunCostsCaptured。
    • 你可以把成本作为你分析的一个权重
    可能还有更多。

    欢呼,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    登录注册置评。