“使用检索在示例集上循环文件”

dragoljubdragoljub 成员职位:241Maven
2019年5月编辑 帮助
嗨,伙计们,

我遇到了一个恼人的问题。检索操作员似乎是罪魁祸首。它只接受到存储库的相对路径。例如:/ /Repository/ExampleSet而不是C:/Repository/ExampleSet.ioo。

目前,我有25个示例集,我想通过循环通过.ioo文件追加,但检索操作符将不接受实际的路径名称。更糟糕的是,%{file_name}宏将返回扩展名为.ioo的名称,所以这也没有帮助。

如何在检索操作符中指定绝对路径(这应该是检索操作符中的复选框选项)?



如何从宏中剥离扩展以欺骗检索操作符?

谢谢,
gagi做
标记:

答案

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    实际上你不能,检索操作符是专为存储库设计的。在后台使用RapidAnalytics,你实际上没有任何文件可以访问…

    所以你能做的就是使用read操作符从磁盘中读取60个文件。

    问候,
    塞巴斯蒂安。
  • dragoljubdragoljub 成员职位:241Maven
    谢谢塞巴斯蒂安,

    我目前将示例集存储为1000个文件。(二进制格式我相信)当我读到你的回答时,我很兴奋,但是读操作符似乎失败了。

    进程失败:无法读取文件“C:\ExampleSet”。io ': java.io.IOException:无法从XML流中读取,格式错误::只允许在开始标记之前的空白内容,而不是* (position: START_DOCUMENT见*…@1: 1)。

    我尝试了各种类型,但都给了我同样的错误。这个操作符实际上可以读取保存到存储库的示例集吗?

    gagi做
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    抱歉,但是存储在内部存储库中的示例集只能被读取,如果它们仍然被内部存储库访问的话。我们刚刚检查过了。

    我猜阻碍您这样做的问题是,您不能循环遍历存储库的条目?

    问候,
    塞巴斯蒂安。
  • dragoljubdragoljub 成员职位:241Maven
    对的,

    我有25 ~300MB的存储库示例集,通过连接许多csv文件创建。我想循环处理这些条目,而不是逐个选择。理想情况下,我可以遍历存储库中的一个文件夹,并选择示例集的NAME,而不使用'。扩展,所以我可以欺骗加载操作符读取数据。到目前为止还没有运气。: - \

    我将尝试通过提取宏到文本来剥离扩展…

    gagi做
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    嗨Gagi做,
    这是有可能的,直到我们添加一个循环存储库操作符:

    循环遍历文件,使用generate Macro操作符使用子字符串或替换删除.io,并使用该宏访问存储库。

    不要忘记把这个很酷的过程贴在我的实验上:)

    问候,
    塞巴斯蒂安。
  • TKTK 成员职位:14因素二世
    有关于如何编写宏的文档吗?特别是关于语法,它是java吗?代码还是其他东西?我得到了相同的“检索和循环”-问题,不知道如何替换“生成宏”中的子字符串。io。

    谢谢!
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    如果您已经定义了一个名为“某事”的宏,那么您可以编写
    %{一}
    参数中的任何位置,如果它是在读取参数时定义的,它将被宏的值所替换。

    问候,
    塞巴斯蒂安。
  • dragoljubdragoljub 成员职位:241Maven
    下面是我如何使用RM Flow执行此操作的。我还在myexperimement.org上发布了这个流程。你可以通过搜索“loop repository”找到它。希望这能帮助到一些人。我相信RM团队很快就会实现一个循环存储库操作符。

    gagi做;)

    < ?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.0 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文








    < /操作符>

    <列出关键= "日志" >

    < / >列表
    < /操作符>


    < /操作符>




    < /操作符>





    < /操作符>


    < /操作符>



    < /操作符>



    < /操作符>

    <列出关键= " function_descriptions " >

    < / >列表
    < /操作符>


    < /操作符>






    < /操作符>






    > < /过程




    < /操作符>




    < /操作符>








    > < /过程
    < /操作符>










    > < /过程
    < /操作符>



    < /操作符>




    > < /过程
    < /操作符>
    > < /过程
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    你可以为此向bug追踪器发布一个特性请求。

    问候,
    塞巴斯蒂安。
登录注册置评。