这里的所有功能请求都由我们的产品团队监控。

投票问题!

拥有高票数(通常≥10票)的想法在我们的路线图中被优先考虑。

注意:如果你想建议一个新的功能,请发布一个新的问题和标签为“功能请求”。谢谢你!

RapidMiner自动模型自定义验证集

christos_karraschristos_karras 成员职位:50大师
2019年10月编辑 产品创意
我想为RapidMiner autommodel做一个功能请求:它应该可以自定义训练和验证数据的分割方式。我经常使用时间序列数据,在这种类型的数据中,在时间上接近的行之间经常存在相关性。autommodel随机分割训练集和验证集,这意味着由于附近行之间的相关性,来自验证集的信息泄漏到训练集。因此,autommodel总是高估了模型在新数据上的效果。autommodel应该允许选择另一种训练-验证分割方法,例如线性抽样。此外,对于内置方法不适合的情况,应该可以为AutoModel指定自定义验证集,以便在AutoModel中尝试之前使用任何方法来分割数据集,从而提供灵活性。
标记:
Jana_OWC
1
1票

开放投票·最后一次更新

刺激- 898

评论

  • varunm1varunm1 主持人,职位:1207年独角兽
    你好@christos_karras

    你能提供更多关于你在汽车模型中寻找什么样的功能的细节吗?
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

  • christos_karraschristos_karras 成员职位:50大师
    @varunm1,请参阅我编辑的描述(在我完成详细内容之前,原始评论已保存)。谢谢
  • varunm1varunm1 主持人,职位:1207年独角兽
    2019年10月编辑
    你好@christos_karras

    谢谢,我看过了。实际上,当前的汽车模型不适合时间序列数据,因为你已经提到了原因,我就不深入了。但是,如果在将数据提供给ML模型之前添加适当的操作符(如窗口),您仍然可以对时间序列使用自动模型过程。这需要在auto model完成流程运行后进入流程进行手动定制。您始终可以在auto模型中打开流程,并仔细地对流程进行更改。在许多情况下,我将拆分更改为交叉验证和@Noel使用自动模型过程的时间序列预测使用窗口算子。由于auto model中有许多连接需要手动定制,因此一开始有点挑战,但由于9.4 auto model中的操作符安排比以前的版本要好得多@IngoRM的。

    @IngoRM如果有时间序列的计划,可能会通知你。我想他肯定会有一些。

    就是2c。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    lionelderkrikor 诺埃尔
  • christos_karraschristos_karras 成员职位:50大师
    是的,正如您所解释的,我不得不自定义由autommodel生成的流程,与简单地使用autommodel相比,这需要更长的时间。虽然对时间序列有更深入的支持是很好的,但在短期内,我认为添加自定义验证集的能力将是一种简单的方法,使其对时间序列数据更有用,或者任何其他随机分割不足够的情况下。

    我知道autommodel并不打算完全取代自定义过程,而只是一种更快入门的方法。然而,如果autommodel高估了某些模型类型的性能,它可能会导致采取错误的方向进行进一步的定制。例如,在不正确的训练-验证分割情况下,autommodel可以确定随机森林是最佳选择,但是当我尝试使用自定义过程时,我可能会发现随机森林不是那么好,使用线性模型会更好。
    varunm1
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    请继续关注时间序列的自动模型;)
    关于在另一个独立数据集上快速尝试模型的第二点:RM 9.4中的新模型操作(部署)视图现在使这变得非常简单。请看下面的视频:
    我建议你看这三个,但第二个会涵盖“得分”功能,这是你需要做的……
    希望这能帮到你,
    Ingo
    诺埃尔 sgenzer varunm1
  • 诺埃尔诺埃尔 成员职位:82Maven
    @IngoRM等不及时间序列的自动模型了!!
    sgenzer
  • 诺埃尔诺埃尔 成员职位:82Maven
    @christos_karras(&@varunm1) -

    需要非常小心地编辑导出的Auto Model过程,以便“转换”用于时间序列。就我个人而言,我并不欣赏其中存在的所有相互联系。(我认为9.4版本会有很大的变化。)
    Tghadially varunm1
  • varunm1varunm1 主持人,职位:1207年独角兽
    @Noel

    @IngoRM总是让我们在新发行的时候处于尴尬境地吗笑脸:
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    sgenzer 诺埃尔 Tghadially
登录注册置评。