“循环遍历存储库中的数据集?”

韦塞尔韦塞尔 成员职位:537大师
2019年6月编辑 帮助
亲爱的所有,

如何对存储库中的不同数据集执行相同的过程?
我不知道如何使用“循环存储库”操作符。

最好的问候,

韦塞尔
标记:

答案

  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    你好,

    下面的过程显示了基本用法:它循环遍历samples目录中的示例集,并将它们作为一个集合交付(当然,您可以在循环中执行任何其他操作,然后只交付数据…)。此外,它还使用日志操作符收集所有数据集的大小,该操作符演示了循环中预定义宏的使用情况。

    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.1.017 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文








    < /操作符>


    < /操作符>

    <列出关键= "日志" >


    < / >列表
    < /操作符>








    > < /过程
    < /操作符>




    > < /过程
    < /操作符>
    > < /过程
    欢呼,
    Ingo
  • 韦塞尔韦塞尔 成员职位:537大师
    亲爱的Ingo,

    非常感谢。
    这招很管用。

    不幸的是,它给出了警告和错误:
    -期望的示例集,但收到的对象。
    —元数据未充分指定。无法检查前提条件。
    我在一个过程中使用它,并且得到这些错误超过20次。
    这有点令人沮丧,因为现在我看不到其他重要的错误了。

    最好的问候,

    韦塞尔


    编辑:我认为诀窍是从文件夹中的第一个数据集传递元数据。
  • 韦塞尔韦塞尔 成员职位:537大师
    这个过程没有错误,尽管你检索每个数据集两次有点奇怪:

    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.1.017 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文









    < /操作符>



    < /操作符>


    < /操作符>

    <列出关键= "日志" >


    < / >列表
    < /操作符>









    > < /过程
    < /操作符>




    > < /过程
    < /操作符>
    > < /过程
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    你好,

    这个过程没有错误,尽管你检索每个数据集两次有点奇怪:
    不,它很有魔力。不要被前两个数据集弄糊涂了:它们的不同之处在于一个有标签,另一个没有标签。因此,示例存储库中确实有两个Golf副本。

    顺便说一下:这些不是“错误”,而是“潜在问题”,正如“问题”视图顶部所述。事实上,元数据没有被充分指定,所以不能保证进程在不实际执行的情况下会运行

    欢呼,
    Ingo
登录注册置评。