介绍新的Shapelet扩展
介绍新的Shapelet扩展
我们,RapidMiner的研究部门,很高兴地宣布新的Shapelet扩展0.1.0版本的发布。发现新的可能性来分析复杂的时间序列数据。对数据执行特定于问题的特征转换,并基于时间序列中的底层模式。
Shapelet算法是在欧盟资助的研究项目PRESED中开发的(参见[1]和[2]),该项目专注于钢铁行业传感器数据挖掘的质量预测。
shapelets的基本思想是,时间序列中的子序列可以表示整个时间序列中重复出现的模式,因此可以将其视为时间序列数据的基函数。此外,一些子序列可能只出现在数据的某些类别中,它们的出现可以用来训练机器学习模型来预测这些类别。
图1:Shapelet算法(也称为EAST)的原理。[3]
为了检索好的候选形状,子序列是从时间序列批次的集合中随机抽取的。然后使用这些候选者在单独的时间序列上执行特征转换。然后将shapelet与新时间序列批进行比较,计算候选shapelet与新时间序列批之间的最小距离。如果许多批次的最小距离很小,则可以认为shapelet在时间序列中经常出现,然后可以将其表示为基函数。
扩展提供了4个新的操作符:
创建搜索空间操作符:
此操作符用于从输入批的集合中绘制候选形状。候选对象收集在“shapelet模型”结果端口处提供的新shapelet模型中。
图2:演示使用create Searchspace操作符创建shapelet模型的过程。
图3:Shapelet模型的可视化选项卡。
Shapelet变换算子:
该操作符接受一个shapelet模型,并对一组输入批次执行特征转换。生成的特征(例如shapelets和新时间序列之间的最小距离)在“features”输出端口提供。
图4:使用Shapelet transformation操作符执行特征转换的演示流程。
图5:shape变换的结果特征向量。
按权重选择Shapelets操作符:
该算子可用于从整个shapelet模型中选择最有意义的shapelet。首先使用Create Searchspace操作符创建一个shapelet模型。然后对标记的数据执行shapelet变换,并使用任意“Weight by”算子根据标签确定计算出的特征的权重。然后,您可以使用Select Shapelet by Weight操作符中的属性权重,仅选择最重要的Shapelet(基函数)并将它们应用于未见过的数据
图6:演示过程,通过使用Select shapelets by Weight操作符,将模型中的shapelets数量减少到只剩下主要shapelets。
图7:从shapelet变换中计算出的特征权重。
图8:简化的shapelet模型,只选择高特征权重的shapelet。
Shapelet Model to ExampleSet操作符
该操作符可用于将shapelet模型中的shapelets转换为ExampleSet以进一步研究它们。
您可以在Marketplace (Shapelet扩展).更多信息参见[3]
[1]陈建军,陈建军,陈建军,陈建军,陈建军,陈建军,陈建军:一种钢铁生产质量改进的参考体系结构。2017年第1届国际数据科学会议,江苏江苏乐鱼平台进入
[2]李建军,李建军,李建军,等。智能数据
[3]陈晓明,陈晓明,陈晓明。基于时间序列的时间模式识别方法研究,计算机科学与技术,2016 (1)
评论
对于网上发布的相关文章也应该有一些沟通。比如,如果我没有跟踪马丁·施密茨@mschmitz我会错过他在媒体上发表的所有文章。用户不应该偶然遇到这个。
我已经附上了相关的pdf。我希望这是可能的,因为这将非常有帮助。
问候,
亚历克斯
德国多特蒙德
亚历克斯
斯科特
叶乐祥,Eamonn J. Keogh:时间序列小波:一种新的数据挖掘原语。KDD 2009: 947-956
大卫