多变量时间序列分析的窗口优化

jqford · 2008年8月

我想优化我的多变量时间序列分析的窗口方案。

在我的分析中，我想探讨的一个重要特征是，窗口大小是否应该针对每个属性进行优化。例如，我的数据表明，“属性A”的过去五次测量与未来的预测相关，但只有“属性B”的过去三次测量是重要的。我担心学习者使用两个额外的“属性B”测量会导致预测误差增加。

我注意到MultivariateSeries2WindowExamples只允许在数据转换中使用单一窗口大小。使用上面的例子，这将导致包含额外的“属性B”度量，这将对我的预测性能产生负面影响。

是否有一种方法为MultivariateSeries2WindowExamples中的每个属性指定一个唯一的窗口大小?是否有其他工具/流程可以让我优化单个属性的窗口大小?

另外，我想知道是否有人使用过这样的方案。我相信一定有一篇关于这个问题的论文，但我没有找到。有什么建议吗?如果需要的话，我不怕做一些尘封的研究。

提前感谢任何输入!

杰克

TobiasMalbrecht · 2008年8月

嗨,杰克,

包括“额外的”(如你所称)滞后值并不一定会对预测性能产生负面影响，因为应用学习者通常会决定在其构建的模型中使用哪些属性。因此，如果学习者认为滞后值对标签有影响，就会在模型中包含相应的属性，否则就不会或至少不会给予它们那么多的重视。

然而(如果你想删除滞后值)从示例集中，你当然可以在应用[tt]MultivariateSeries2WindowExamples[/tt]之后，通过应用[tt]FeatureNameFilter[/tt]从示例集中删除相应的属性，在学习者应用之前。

希望有所帮助,
托拜厄斯

jqford · 2008年8月

这是非常有用的!

谢谢托拜厄斯。

杰克

黑线鳕 · 2008年8月

嗨,杰克,

听起来我们在挖掘同样的东西;我使用了大约50个指标，每个指标的回望范围为30天，给出了1500个属性。如果你在参数优化中包含一个滑动窗口验证，你可以调整训练窗口的大小和其他东西，以便看到你的回看应该是什么。

Tobias是对的，我知道不管不顾地把东西塞进去听起来很无聊，但那是RM喜欢的，你总是可以为自己的行为辩护，说你在谨慎地避免偏见!

你好,陌生人!

快速链接

类别

RapidMiner社区

得到帮助。学习的最佳实践。与同事建立联系。

多变量时间序列分析的窗口优化

答案