多变量时间序列分析的窗口优化

jqfordjqford 成员职位:2贡献我
2019年5月编辑 帮助
我想优化我的多变量时间序列分析的窗口方案。

在我的分析中,我想探讨的一个重要特征是,窗口大小是否应该针对每个属性进行优化。例如,我的数据表明,“属性A”的过去五次测量与未来的预测相关,但只有“属性B”的过去三次测量是重要的。我担心学习者使用两个额外的“属性B”测量会导致预测误差增加。

我注意到MultivariateSeries2WindowExamples只允许在数据转换中使用单一窗口大小。使用上面的例子,这将导致包含额外的“属性B”度量,这将对我的预测性能产生负面影响。

是否有一种方法为MultivariateSeries2WindowExamples中的每个属性指定一个唯一的窗口大小?是否有其他工具/流程可以让我优化单个属性的窗口大小?

另外,我想知道是否有人使用过这样的方案。我相信一定有一篇关于这个问题的论文,但我没有找到。有什么建议吗?如果需要的话,我不怕做一些尘封的研究。

提前感谢任何输入!

杰克

标记:

答案

  • TobiasMalbrechtTobiasMalbrecht 主持人、雇员、成员职位:291RM产品管理
    嗨,杰克,

    包括“额外的”(如你所称)滞后值并不一定会对预测性能产生负面影响,因为应用学习者通常会决定在其构建的模型中使用哪些属性。因此,如果学习者认为滞后值对标签有影响,就会在模型中包含相应的属性,否则就不会或至少不会给予它们那么多的重视。

    然而(如果你想删除滞后值)从示例集中,你当然可以在应用[tt]MultivariateSeries2WindowExamples[/tt]之后,通过应用[tt]FeatureNameFilter[/tt]从示例集中删除相应的属性,在学习者应用之前。

    希望有所帮助,
    托拜厄斯
  • jqfordjqford 成员职位:2贡献我
    这是非常有用的!

    谢谢托拜厄斯。

    杰克
  • 黑线鳕黑线鳕 成员职位:849Maven
    嗨,杰克,

    听起来我们在挖掘同样的东西;我使用了大约50个指标,每个指标的回望范围为30天,给出了1500个属性。如果你在参数优化中包含一个滑动窗口验证,你可以调整训练窗口的大小和其他东西,以便看到你的回看应该是什么。

    Tobias是对的,我知道不管不顾地把东西塞进去听起来很无聊,但那是RM喜欢的,你总是可以为自己的行为辩护,说你在谨慎地避免偏见!
登录注册置评。