多变量时间序列分析的窗口优化
我想优化我的多变量时间序列分析的窗口方案。
在我的分析中,我想探讨的一个重要特征是,窗口大小是否应该针对每个属性进行优化。例如,我的数据表明,“属性A”的过去五次测量与未来的预测相关,但只有“属性B”的过去三次测量是重要的。我担心学习者使用两个额外的“属性B”测量会导致预测误差增加。
我注意到MultivariateSeries2WindowExamples只允许在数据转换中使用单一窗口大小。使用上面的例子,这将导致包含额外的“属性B”度量,这将对我的预测性能产生负面影响。
是否有一种方法为MultivariateSeries2WindowExamples中的每个属性指定一个唯一的窗口大小?是否有其他工具/流程可以让我优化单个属性的窗口大小?
另外,我想知道是否有人使用过这样的方案。我相信一定有一篇关于这个问题的论文,但我没有找到。有什么建议吗?如果需要的话,我不怕做一些尘封的研究。
提前感谢任何输入!
杰克
在我的分析中,我想探讨的一个重要特征是,窗口大小是否应该针对每个属性进行优化。例如,我的数据表明,“属性A”的过去五次测量与未来的预测相关,但只有“属性B”的过去三次测量是重要的。我担心学习者使用两个额外的“属性B”测量会导致预测误差增加。
我注意到MultivariateSeries2WindowExamples只允许在数据转换中使用单一窗口大小。使用上面的例子,这将导致包含额外的“属性B”度量,这将对我的预测性能产生负面影响。
是否有一种方法为MultivariateSeries2WindowExamples中的每个属性指定一个唯一的窗口大小?是否有其他工具/流程可以让我优化单个属性的窗口大小?
另外,我想知道是否有人使用过这样的方案。我相信一定有一篇关于这个问题的论文,但我没有找到。有什么建议吗?如果需要的话,我不怕做一些尘封的研究。
提前感谢任何输入!
杰克
标记:
0
答案
包括“额外的”(如你所称)滞后值并不一定会对预测性能产生负面影响,因为应用学习者通常会决定在其构建的模型中使用哪些属性。因此,如果学习者认为滞后值对标签有影响,就会在模型中包含相应的属性,否则就不会或至少不会给予它们那么多的重视。
然而(如果你想删除滞后值)从示例集中,你当然可以在应用[tt]MultivariateSeries2WindowExamples[/tt]之后,通过应用[tt]FeatureNameFilter[/tt]从示例集中删除相应的属性,在学习者应用之前。
希望有所帮助,
托拜厄斯
谢谢托拜厄斯。
杰克
听起来我们在挖掘同样的东西;我使用了大约50个指标,每个指标的回望范围为30天,给出了1500个属性。如果你在参数优化中包含一个滑动窗口验证,你可以调整训练窗口的大小和其他东西,以便看到你的回看应该是什么。
Tobias是对的,我知道不管不顾地把东西塞进去听起来很无聊,但那是RM喜欢的,你总是可以为自己的行为辩护,说你在谨慎地避免偏见!