当RMSE/SE过高时如何降低RMSE/SE

User111113User111113 成员职位:24Maven
你好,

我的数据有2个整数和所有其他的多项式属性
id
状态
一年

领导(int)
反应(int)
typeOfMail
状态

我使用分裂模型,将我的数据在20个月和2个月之间分割为22个月,我得到了12.41 RSME和squared_error: 154.176 +/- 335.663。

我不知道如何减少这种情况,也不确定是否可以应用任何其他模型,因为我认为我的选择是有限的




我已经尝试过在应用这些模型时使用其他组合,如添加K-NN和决策树,但这没有帮助

此外,试图在18个月到4个月之间分割数据,总共22个月,这也没有帮助







我该怎么办?
Jasmine_

最佳答案

答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年1月编辑
    你好@User111113

    您可以在流程中添加特性选择和超参数优化。使用“自动特征工程”操作符进行特征选择,使用“优化超参数(网格)”进行超参数选择。这两个都应该在验证操作符的训练端。

    我不知道你有多少数据,但如果不是很大,那么你的模型可能会过拟合,因为你使用的是两个复杂且数据饥渴的算法。

    您还可以使用相同的自动功能工程生成新功能。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施,保持社交距离

    Jasmine_ lionelderkrikor
  • User111113User111113 成员职位:24Maven
    @varunm1

    谢谢你的回复。我在哪里添加“自动功能工程”操作符在我的过程中,你可以看到从上面的截图。

    我是否应该同时使用这两个运算符这里说的"应该在验证运算符的训练端"你的意思是在我的模型所在的地方所以从乘法运算符到其中一个运算符再到模型的另一个链接?

    我想使用自动功能生成,但不确定我应该如何以及在哪里放置.....我使用的是过去两年的数据,我仍然认为对这种类型的预测是不够的。

    请帮助我下一步,谢谢。




    Jasmine_
  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年1月编辑
    下面是我快速构建的示例流程。您可以看到验证操作符的内部,还可以观察到我为每个操作符选择的参数。

    您可以通过下载到您的PC并在rapidminer中选择File—> import process来导入此文件。

    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施,保持社交距离

    Jasmine_ sgenzer User111113 lionelderkrikor
  • User111113User111113 成员职位:24Maven
    谢谢,我现在正试着这么做。
    Jasmine_
  • User111113User111113 成员职位:24Maven
    @varunm1
    谢谢你的回复。

    我得到了这个错误。我仍然有点困惑,我应该在“优化参数(网格)”操作符中选择哪些参数。

    我确实选择了样本中有什么,但我得到了下面的错误,所以现在我要用其他东西再次运行它。

    由于某些原因,每次运行大约需要25分钟才能完成,所以不知道如何减少这个时间,但降低错误率是很重要的


    Jasmine_
登录注册置评。