将预测模型应用于数值
akselerator
成员职位:3.学我
Hi Rapid Miner社区
新来的,这是我的第一个问题。希望能加入这个很棒的社区!
我正试图进一步预测/了解我的工作中成本上升的原因。我的问题有点像泰坦尼克号的预测练习。
现在来看问题:
我有一个数据集,包含我公司运输投资组合的分类成本超支(比如运输大型船只)和相关变量,这些变量可以解释为什么会发生这些超支(POD/POL/目的地/类型/规模等)。问题是,它不是Cost overflow =Yes/No,而是代表溢出的大小/严重性的数值,我无法理解如何创建一个考虑到这一点的预测模型。此外,我希望得到一个输出,解释为什么模型预测它所做的,这样我就可以确保消除这些错误。
感谢所有花时间帮助我的人!
编辑:我现在只有大约65个项目的数据。其目的是构建它,并在项目完成时不断向它提供信息。不能再往前追溯了。这意味着autommodel不能工作。
亲切的问候
Aksel
新来的,这是我的第一个问题。希望能加入这个很棒的社区!
我正试图进一步预测/了解我的工作中成本上升的原因。我的问题有点像泰坦尼克号的预测练习。
现在来看问题:
我有一个数据集,包含我公司运输投资组合的分类成本超支(比如运输大型船只)和相关变量,这些变量可以解释为什么会发生这些超支(POD/POL/目的地/类型/规模等)。问题是,它不是Cost overflow =Yes/No,而是代表溢出的大小/严重性的数值,我无法理解如何创建一个考虑到这一点的预测模型。此外,我希望得到一个输出,解释为什么模型预测它所做的,这样我就可以确保消除这些错误。
感谢所有花时间帮助我的人!
编辑:我现在只有大约65个项目的数据。其目的是构建它,并在项目完成时不断向它提供信息。不能再往前追溯了。这意味着autommodel不能工作。
亲切的问候
Aksel
0
最佳答案
-
MartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家你好,你可以做几件事:
- 您可以构建一个回归问题并预测溢出的数量。
- 你可以做一个分类问题,然后定义一个自己的性能指标为平均\sum OverRunCostsCaptured。
- 你可以把成本作为你分析的一个权重
可能还有更多。
欢呼,马丁
- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德0 - 您可以构建一个回归问题并预测溢出的数量。