支持向量机-数据输入

mburgermburger 成员职位:1贡献我
2019年6月编辑 帮助
你好,

现在我试图用SVM创建一个简单的预测模型,它应该能够识别季节性或其他对我的影响,比如说,销售。
我已经研究了窗口操作符,它将我的训练数据分割为不同的时间元素,如下所示:

变量|标签
V1 v2 v3 v4 v5 |v6
V2 v3 v4 v5 v6 |v7
V3 v4 v5 v6 v7 |v8


第一个问题:我应该转换输入吗?如果数据是1,5,12,0,0…假设这是销售额。我应该在0和1之间缩放吗?

此外,我想让我的模特知道,如果有什么特别的事情发生。因此,我创建了一个新的属性,如u,它包含圣诞节假期的信息。

变量|标签
V1 v2 v3 v4 v5 u1 u2 u3 u4 u5 |v6
V2 v3 v4 v5 v6 u2 u3 u4 u5 u6 |v7

例如v: 1,5,12,0,0 u: 1,1,1,0,0

在这种情况下,你应该告诉我,在我的时间段的前3天(销售1,5,12),销售受到圣诞节假期的影响。
这样做对吗?如果我把v缩放到1和0之间,我有一个二进制变量u,有0和1,支持向量机能很好地处理它吗?

下一个问题是:圣诞节的影响不仅仅是1和0,如果我想在游戏中建立一个季节性的发展
圣诞节促销,我会怎么做?调整值如0.2,0.3,0.4?

而且,我用5天的窗口来预测第二天,所以窗口不会覆盖整个赛季。会有危险吗
很长一段时间没有圣诞节销售,我定期训练我的模型,它“忘记”圣诞节?

如果我解决了上面所有的问题,我有一个新的模型,它考虑到圣诞节和一切都可以给预测一个很好的提示,
我知道必须告诉模型它应该预测哪种情况。假设,我有:

变量/情况|预测
V1 v2 v3 v4 v5 u1 u2 u3 u4 u5 |f6
V2 v3 v4 v5 v6 u2 u3 u4 u5 u6 |f7

我怎么告诉f6的模型会有圣诞节?因为我只是和你描述过去?

问候

马丁


答案

  • MariusHelfMariusHelf RapidMiner认证专家,会员职位:1869年独角兽
    你好,

    如果一个窗口没有覆盖整个赛季,只要你的训练集覆盖了,那就没问题。这样至少有一些输入数据包含圣诞数据,所以你的模型可以适应它。

    关于你只覆盖过去的问题:你也可以从未来增加价值。这是有效的,因为在过去也知道12月将是圣诞节,所以你不要在你的训练数据中添加任何无效的信息。
    为了达到这个目的,你必须将窗口u和v分开,然后将它们连接在一起。如果你在RapidMiner中需要技术上的帮助,请告诉我们:)

    最好的问候,
    马吕斯
登录注册置评。