分类?/标签吗?时间序列示例

AndryehAndryeh 成员职位:8学我
嗨。我是新手,但我想我能应付大部分。我正在努力解决的一件事是,我有一组时间序列示例,我基本上想把它们分成两组,True和False,这样我就可以在它们上使用深度学习扩展。应用DL算子进行预测的标签的最佳方式是什么?我能把它们分成两组吗?“标记”示例集?我只是在底部添加一个额外的行,其中有True或False,然后让运算符预测它吗?

谢谢。

答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:797独角兽
    嗨!

    为了进行分类,数据必须采用表格格式,一行表示一个示例,并将标签作为属性。

    这意味着您需要将时间序列转换为这种格式。例如,您可以按时间范围提取最小值、最大值和百分位数(如果它们不是同一时间跨度)等等。转置和主元是你们可能会用到的算子。

    问候,
    Balazs
  • AndryehAndryeh 成员职位:8学我
    谢谢,我可以这样做,但我不确定这对深度学习算子有什么影响。深度学习操作符在时间序列布局中的数据与在单行示例中的数据有什么不同吗?它们都是相同的数据,只是布局不同。DL在乎吗?
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:797独角兽
    嗨!

    在RapidMiner中,您总是设置一个以行为示例的表,并设置一个用于分类和回归的标签属性。

    也有时间序列预测方法,采用一个时间序列,可以预测该序列的未来值。但这不是你来这里的目的。这是完全不同的操作,需要不同布局的数据。

    在将深度学习操作符放入您的过程后查看它。它的输入是一个示例集,并且帮助告诉您它需要一个“有标签的示例集”。这是一个带有label属性的表。它不能直接把时间序列作为输入。您可以从时间序列中创建一个示例集,并使用window等操作符为预测创建属性,然后将原始时间序列属性设置为标签。但这是一个序列的一个回归模型。

    问候,
    Balazs
  • AndryehAndryeh 成员职位:8学我
    谢谢,有道理。我需要澄清的是,我实际使用的是张量,我理解它比编程意义上的对象更好。

    其实我没料到会这么难。我想应该有某种方式来“标记”张量。它是如何使用图像进行训练的?它们可以用张量的形式表示。例如,你在训练模型分辨图片中是狗还是猫,在训练过程中你如何告诉模型它看到的是狗还是猫?可能是RapidMiner不是我需要的工具吗?

    如果我说了什么愚蠢的话,我再次道歉。
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:797独角兽
    你好,

    请查看深度学习扩展的深入介绍:
    https://community.www.turtlecreekpls.com/discussion/52670/a-more-native-deep-learning-solution
    它使您能够构建具有不同神经元节点类型的自定义神经网络,并将其作为模型进行处理。
    这也可以用于图像分类。

    你是如何构造张量的?你可能有非张量格式的底层数据或者你可以再次从张量中提取原始数据。

    你用张量做什么?在这个用例中,您希望比较这些时间序列的属性并对它们进行分类。这意味着您需要推断出这些属性,并将它们放入适合分类的示例集中。我描述它的方式是RapidMiner的方式,还有R和Python。

    没有办法把一堆张量对象放到一个算子里,并期望它对它们进行分类。

    在大多数情况下,数据预处理占项目时间的70- 80%。在这种情况下,您的数据格式不适合分类,而您希望它们采用这种格式。我描述了在RapidMiner中处理时间序列数据的方法。

    问候,
    Balazs
    lionelderkrikor
登录注册置评。