我如何使现有的进程(引用Excel导入)现在识别读取Excel路径?

SkyTrader"class=SkyTrader 成员职位:88因素二世
大家好,我是在观看这个名为“详细阐述时间序列分析”的视频时开始创建流程的。

我现在意识到,将Excel文件导入RM(这是我最初选择的)和通过像Read Excel这样的操作符引用Excel文件以及在计算机上创建Excel文件的文件路径之间是有区别的。

问题是到目前为止我所有的进程和操作符都引用了我使用导入向导物理导入的Excel文件…但我现在已经在存储库中删除了这个文件,因为我的Excel文件会定期更新,我意识到最好使用“读取Excel”和“存储”,并引用我要更新的Macbook上的文件,

所以我的问题是,我如何或可以使这些现有的操作符我已经建立现在找到/指向Macbook文件(而不是指向物理导入的文件在存储库)?

我有一个“检索”(从Excel数据文件中的道琼斯日报信息)操作符在下一个过程进行傅里叶变换之前,显然“检索”现在不能访问原始导入的文件(我删除了它),但右上方的参数窗口只允许这个操作符在存储库中查找?我必须从头开始创建这些进程和操作符吗?

另外,如果我使用连接到“读取Excel操作符”的“Store”操作符,“Store”不会停止RM读取/访问存储在Macbook上的Excel文件的最新更新版本吗(假设我可以将这些操作符重新指向Macbook文件)?

为任何帮助干杯!

答案

  • BalazsBarany"class=BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:905独角兽
    嗨!

    最好的方法是使用向导设置的Read Excel操作符创建流程。这将始终从Excel表中读取当前数据,并将其作为流程输出中的表返回。

    然后,您可以使用Execute Process(或者只是从存储库中拖放)将这些数据放到其他流程中,并用静态数据替换现有的Retrieve。然后您将始终使用当前数据。

    问候,
    Balazs
  • SkyTrader"class=SkyTrader 成员职位:88因素二世
    谢谢@BalazsBarany

    我读过“执行过程”的说明,但教程完全把我弄糊涂了。

    所以我可以将读取操作符放入流程并使用执行流程操作符?

    和那些进程,我已经创建使用Excel直接导入将不得不有这个“执行过程”添加到他们,但我仍然不清楚如何做到这一点,在操作符的顺序/层次结构?

    另外:
    “然后你可以把这个(读取Excel)到你的其他进程使用执行过程(或只是拖放从存储库)....”

    我仍然不确定如何做到这一点的顺序/层次?

    并将现有的检索替换为静态数据。

    我是否实际地用静态数据替换现有的Retrieve—我假设是Read操作符?那么,Store是如何融入这一切的呢?特别是在我最初的问题中?

    再次感谢,

  • BalazsBarany"class=BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:905独角兽
    你好,

    我指的是在RapidMiner中执行另一个进程的两种方式。
    1.插入Execute Process,从存储库中选择要执行的进程。
    2.只需将它从存储库拖放到流程中。Execute Process操作符将与存储库路径一起自动设置。(如果您拖动其他存储库对象,它们将被Retrieve打开,但不会被进程打开。)

    试试吧,你会发现它是如何工作的。

    在其他流程中,现在您使用Retrieve引用存储库中设置的静态示例。你想用Read Excel来执行你的流程,而不是这样。因此,您将Retrieve替换为读取Excel文件的Execute Process。

    如果您希望确保在不同的进程中读取相同的数据(例如,如果您的文件频繁更新且进程花费较长时间),则应该采用不同的方法。
    一个导入流程:Read Excel => Store
    在其他流程中:检索存储的数据。

    然后,您可以控制导入和处理Excel文件的哪种状态。

    您可以在数据访问和准备下观看前两个学院视频:
  • SkyTrader"class=SkyTrader 成员职位:88因素二世
    2020年8月编辑
    感谢Balázs,在使用RM的早期阶段,并且能够很好地跟随时间序列视频,我只是在寻找一个“连接操作员a到操作员B”类型的答案,因为你假设我可以物理连接/找到我不能的所有东西!

    我问了一个具体的问题,我不明白从你的回答如何推进我的项目。

    好吧,我经历了一段艰难的过程,学会了跟随视频“详细阐述你的时间序列分析”并没有考虑到我将不断更新我的Excel文件。因此,想要使用像我已经创建的傅里叶变换这样的过程(从观看那个视频中),现在使用读取Excel操作符,我想要能够使用当我使用导入Excel到存储库时创建的许多过程,像我现在拥有的傅里叶变换这样的过程。

    我明白我必须使用执行过程…但是请理解RM中关于窗口RHS的描述并不总是容易理解或遵循,特别是对于这个操作员:

    例如:描述
    此操作符(Execute Process)可用于将已保存流程的完整流程定义嵌入到当前流程定义”。

    当前流程定义??

    这就是为什么我喜欢看视频…

    “1。插入Execute Process,从存储库中选择要执行的流程。”

    我查了我能找到的唯一一个关于执行过程的视频,它是2018年的,它已经过时了,因为我不知道怎么做 从存储库中选择要执行的流程。”在视频中,这很简单,因为有:过程和上下文,后者我找不到?https://www.youtube.com/watch?v=X2HYB2j3AX8在2.20秒。

    2.只需将它从存储库拖放到流程中。
    将什么拖到哪个过程中?

    实际上,我认为删除我从detailed视频中学到的流程(使用导入Excel文件到存储库中创建,并重新使用Read Excel)可能会更快。

    所以你替换了检索使用读取Excel文件的执行过程。”

    我从概念上理解了它,我只是不确定当我有这个时,如何在物理上建立这些联系:



    因此Execute Process操作符有一个附加/导入Excel的进程在某种程度上-虽然我还不知道该怎么做?

    谢谢你的耐心。

登录注册置评。