我应该使用什么值与ARIMA PDQ?

SkyTraderSkyTrader 成员职位:88因素二世
2020年9月编辑 帮助
你好,

P和Q值不为零?

我已经尝试了各种不同的值,但不能摆脱这个警告?



谢谢你的帮助,
标记:

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    你好,
    请更改优化网格中的参数,它将覆盖您在ARIMA中设置的参数。

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • SkyTraderSkyTrader 成员职位:88因素二世
    嗨,马丁,@mschmitz
    我正在查看您APPL ARIMA过程的优化网格中的p和q值,但我没有看到任何p或q值设置= 0并且会导致“不允许0”警告?最小值是从1开始,而不是0?我要改变什么,要改变到什么价值?

    欢呼,



  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    如果你愿意,可以试试0。我想这是允许的。
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • SkyTraderSkyTrader 成员职位:88因素二世
    2020年9月编辑
    但是警告说p = 0和q = 0是不允许的?
    不管怎样,我把p和q的1改成了0但是没有区别,我还是得到了相同的警告?
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    2020年9月编辑
    @SkyTrader,嗨@mschmitz

    是的,我确认如果p=0q=0,误差增加了RM美国消费数据的自动化ARIMA过程(从时间序列模板)

    有一个简单的治标方法:

    优化参数操作员,设置参数错误处理=忽略错误

    希望这能帮到你,

    问候,

    莱昂内尔

    PS:如果这个解决方案不能解决你的错误,请分享你的过程和数据。

    编辑:

    对于您的用例,我认为您只能使用这些值进行参数搜索:

    P = 1,2,3,4,5
    D = 0,1,2
    Q = 0,1,2,3,4,5


  • SkyTraderSkyTrader 成员职位:88因素二世
    @lionelderkrikor@mschmitz

    非常感谢,我将“错误处理”设置为“忽略”,这消除了p,d,q警告,但该过程停止,我的Macbook每次运行时都会产生84%的彩色轮(这是一个大型道琼斯数据文件,有5000行加上许多技术指标)。我没有得到任何错误信息,但解决问题的唯一方法是保持强制退出RM?





  • hughesfleming68hughesfleming68 成员职位:323独角兽
    你好,Skytrader,你的预测使用了多少数据?如果您正在使用滑动窗口验证来查看多年来模型的执行情况,这是一回事。如果你在做预测,那么你需要的数据就少得多。10年前发生的事情与现在的情况毫无关系。不是在财务数据中。
  • SkyTraderSkyTrader 成员职位:88因素二世
    @hughesfleming68
    在这个特殊的运行中,我使用2000-2020年的每日(包括2003年,2007年和2020年的崩溃)。我有一个20天的窗口大小和5天的地平线。

    是优化过程导致了冻结,因为ARIMA在未优化时使用该数据集?

  • hughesfleming68hughesfleming68 成员职位:323独角兽
    2020年9月编辑
    嗨SkyTrader,

    在我看来,数据太多了。仅从价格数据来看,没有多少信号。最好是沿着目前驱动价格的因素来思考这个问题。2008年当然什么都没发生。

    也许最好不要考虑预测价格,而只是考虑在你感兴趣的时期内的积极或消极偏差。你可以把它看作一个分类问题。

    我认为预测在算法交易中有一席之地,但只是在很短的时间框架内。当然不是几天,也不是每时每刻。信噪比变化很大,很多时候,你的预测是随机的。你必须准备好经常犯错。

    我也认为Arima不适合做这项工作。价格走势太不规律。
    SkyTrader
  • SkyTraderSkyTrader 成员职位:88因素二世
    2020年9月编辑
    为Alex的输入欢呼,@hughesfleming68
    我接受你关于数据量的观点,我看过人们讨论这个问题,也读过一些研究论文,其中使用了几年的数据(甚至更多)。我还没听说过用不到几天的。

    回复:ARIMA,我的印象是,通过Fabian的视频阐述你的时间序列,有可能得到很好的预测,这让我很受鼓舞。cinc https://www.youtube.com/watch?v=Hvdh8ItfiGA& ab_channel = RapidMiner % 2。

    我也在使用随机森林过程,但只是不能让它预测超出我的数据集的任何点,使用马丁建议的应用模型操作符和滞后操作符。

    我很想知道你发现哪种算法最适合这种类型的任务,你的目标是基于实际价格目标的分类来获得预测吗?

    非常感谢,

  • hughesfleming68hughesfleming68 成员职位:323独角兽
    2020年9月编辑
    嗨SkyTrader,

    我认为你需要回顾一下哪些机器学习操作员可以推断。随机森林无法做到这一点。我也会对学术论文持谨慎态度。我看过很多这样或那样有缺陷的项目或者有不可重复的结果。最后,您必须亲自测试所有内容。请记住,即使你解决了你的预测问题,你仍然需要将你的预测转移到现实世界。你的预测可能在验证后看起来不错,但当你尝试执行它时仍然会赔钱。这个问题有两个部分,预测和执行策略。不要低估了第二部分的难度。

    我仍然认为分类是一个更好的方法这可以是一个纯粹的分类任务你给你的数据贴上标签,然后预测类别或者你可以用回归把它变成一个分类问题仅仅通过平均斜率。

    你的属性将决定你的模型是否有机会预测任何事情,如果你选择的属性基本上是随机的,那么你的预测也将是随机的。这适用于交易软件中常见的几乎所有技术指标,如果不是所有技术指标的话。在这一点上没有优势,从总体上看,价格动量也很少。如果使用一些指标作为属性,然后插入随机森林并突然赚钱是那么容易的话,那么每个人都会这么做。你必须深入挖掘才能找到自己的优势。

    随机森林可以很好地处理正确的数据集,但我更倾向于直接使用神经网络来处理这种从极其简单到极其复杂的工作。从他们那里得到结果不是即插即用的。

    你应该读三本书....

    1.金融机器学习的进展,作者:Marcos Lopez de Prado。

    2.Stefan Jansen的《机器学习算法交易》

    3.任何一本关于概率的好书

    通过机器学习和金融,你可以实现很多事情。问题是,价格预测排在最后,甚至可能没有必要。贸易是一种反动的行业,政权在不断变化。建立一个过程,帮助你确定在任何时候发生了什么。从长远来看,你会有更好的结果。

    问候,

    亚历克斯


    lionelderkrikor
登录注册置评。