替换时间序列的最后一行缺失值

赫利俄斯赫利俄斯 成员职位:2学我
大家好!

我只想对我们公司的销售数字做一个简单的预测。我有我们一款产品从2012年到2020年的数据,我只是想预测2021年的销售数字,这样我就可以把它与实际销售数字进行比较。

我只是不想用平均值或其他方法来替换缺失的数。尝试用线性插值“替换缺失数字(时间序列)”算子,但似乎无法替换缺失值的最后一行。我如何解决这个问题,或者我应该使用knn,决策树或神经网络来预测它?

如果我们成功预测了数字,我还想比较不同方法的预测值。如果这是一个简单的解决方案,比如比较预测值与实数的接近程度(例如很难理解和向老板解释均方根误差),我会很感激。

也许我做错了所有的过程,但对于你的答案,我仍在努力学习。




标记:

最佳答案

  • ceaperezceaperez 成员职位:343独角兽
    解决方案接受
    @Helios

    我给你两个简单的选择
    第一个是将“确保有限值”选项签入Replace missing values操作符中。
    第二种方法是使用一个简单的Arima模型来预测最后一个缺失值。
    附件是修改后的工艺流程。

    最好的

    塞萨尔

答案

  • 赫利俄斯赫利俄斯 成员职位:2学我
    @ceaperez泰,谢谢你的回答,

    我检查了你发来的流程,非常感谢。

    对于“替换丢失的值(时间序列)”操作符,即使我检查了确保无限值选项,它仍然替换丢失的值,如上一个值。所以它仍然不是线性插值或者我做错了什么。



    Arima模型工作得很好。我得到了这个结果:



    但我在ARIMA模型上工作,在我取消选择“估计常数”选项后,我得到了更接近实际值18.085的结果。


    我不知道禁用估计常数选项是一个好的决定或不是,但我仍然在寻找更好的或可选的模型。但是非常感谢@ceaperez

登录注册置评。