类别

版本

您正在查看版本9.3 -的RapidMiner Studio文档查看最新版本

华宇电脑(时间序列)

剧情简介

该运算符为选定的时间序列属性训练ARIMA模型。

描述

ARIMA是自回归综合移动平均。通常情况下,ARIMA模型用于预测时间序列。

ARIMA模型由它的三个部分定义订单参数,p, d, q。p表示模型中自回归项的个数。D指定应用在时间序列值上的差分数。q指定模型中移动平均项的数量。

ARIMA模型是一个集成的ARMA模型。ARMA模型通过滞后时间序列值的加权和(自回归项)和滞后残差的加权和来描述时间序列。这些残差来源于正态分布噪声过程。“一体化”表示ARMA模型的值是一体化的,等于ARMA模型所描述的原始时间序列值是微分的。

ARIMA算子将给定p,d,q的ARIMA模型拟合到时间序列,通过找到p+q系数(如果估计常数为真,常数),使描述时间序列的模型的条件对数似然最大化。优化采用LBFGS (Limited-memory Broyden-Fletcher-Foldfarb-Shanno)算法。

如果为p,d,q选择值,重要的是,如果参数的数量(p,d,q的和)不在时间序列长度的顺序中,条件对数似然只是对精确对数似然的一个很好的估计。因此,参数的数量应该远远小于时间序列的长度。

训练好的ARIMA模型如何描述给定的时间序列通常是用Akaikes信息准则(另类投资会议)、贝叶斯信息准则(BIC)或更正后的赤池资讯标准(AICC)。ArimaTrainer运算符计算这些性能度量,并输出包含计算值的性能向量。ARIMA模型对时间序列的描述具有较小的信息条件。

这个运算符只适用于数值时间序列。

分化

此运算符类似于其他建模运算符,但专门用于处理时间序列数据。这其中的一个含义是,预测模型应该应用于它训练的相同数据。

应用预测

这个算子接收一个训练过的预测模型(例如ARIMA模型),并为训练过的时间序列创建预测。

违约预测

该操作员在时间序列数据上训练默认预测模型(预测单个值)来执行预测。

功能和季节成分预测

该操作员在时间序列数据上训练函数和季节预测模型(结合拟合函数和季节分量值)来执行预测。

Holt-Winters

该操作员在时间序列数据上训练Holt-Winters模型(三指数平滑)来执行预测。

输入

  • 榜样(IOObject)

    包含时间序列数据作为属性的示例集。

输出

  • 预测模型(IOObject)

    ARIMA模型(预测模型)拟合指定的时间序列属性。它还包含原始的时间序列值。

  • 性能(性能向量)

    该端口提供了拟合的ARIMA模型的性能向量。计算的性能为赤池信息准则AIC、贝叶斯信息准则BIC和赤池信息准则AICC(校正后)。

  • 原始(IOObject)

    作为输入的ExampleSet被不加更改地传递。

参数

  • time_series_attribute

    应该为其构建ARIMA模型的时间序列属性(数值)。可以从该选项中选择所需的属性。如果元数据已知,可以从参数的下拉框中选择属性名。

    范围:
  • has_indices

    此参数表示是否有与时间序列关联的索引属性。如果该参数设置为true,则必须选择索引属性。

    范围:
  • indices_attribute

    如果参数有指标设置为true时,此参数定义关联的索引属性。它可以是日期、date_time或数值类型属性。如果元数据已知,可以从参数的下拉框中选择属性名。

    范围:
  • p: _order_of_the_autoregressive_model

    的参数p指定ARIMA模型的自回归部分使用的滞后数。

    范围:
  • d: _degree_of_differencing

    的参数d指定时间序列值的区分频率。

    范围:
  • 问:_order_of_the_moving-average_model

    的参数指定模型的移动平均部分的顺序。

    范围:
  • estimate_constant

    该参数表示是否应该估计ARIMA进程的常数。

    范围:
  • main_criterion

    在性能向量中作为主要标准的性能度量。

    • aic: Akaikes信息准则:对给定数据集统计模型相对质量的估计量。aic处理的是模型的拟合优度和模型的简单性之间的权衡
    • bic:贝叶斯信息准则(Bayesian Information Criterion):类似于aic,但对模型中的参数数量有更大的惩罚项。
    • aicc:校正的Akaikes信息标准:aicc性能衡量标准是对小样本量进行校正的aic,以防止过拟合。
    范围:

教程的过程

休伦湖上的Arima数据

本教程通过在休伦湖数据集上训练ARIMA模型,展示了ARIMA运算符的基本用法。

Arima生成的数据

本教程流程首先基于ARIMA流程生成数据。然后将ARIMA应用于这些数据,并创建一个预测模型。

汽车Arima

在本教程过程中,使用优化网格操作符来寻找描述休伦湖数据集的最佳拟合ARIMA模型。