"[已解决]遍历文件(从第一行提取id)"

earmijoearmijo 成员职位:265独角兽
2019年6月编辑 帮助
亲爱的专家:

我有大约2000个文本文件与以下结构:
第一行:客户id后面跟着一个冒号
接下来的k行:客户交易数据(x1,x2,x3,x4)

——file01.txt ------------------
01:
* 13, x11, x12 x14
将,x21 x23 x24
.....
xk1、xk2 xk3 xk4
——file02.txt -------------------
02:
* 13, x11, x12 x14
将,x21 x23 x24
.....
xk1、xk2 xk3 xk4
——file03.txt -------------------
03:
* 13, x11, x12 x14
将,x21 x23 x24
.....
xk1、xk2 xk3 xk4
——file04.txt --------------------
04:
* 13, x11, x12 x14
将,x21 x23 x24
.....
xk1、xk2 xk3 xk4


我想要的是将它们合并到一个包含以下列的文件中

id, x1, x2, x3, x4

有一个简单的方法来做它在RapidMiner?

提前感谢,

\埃内斯托
标记:

答案

  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    当然你可以用RapidMiner来做: D请查看附件的流程。它使用Loop Files操作符遍历所有文件。它逐行读取它们,使用Extract Macro提取第一行,删除第一行,然后用逗号分隔其余行。

    最好的
    马吕斯
    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.2.003 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文










    <列出关键= "注释" / >

    <列出关键= " data_set_meta_data_information " >

    < / >列表
    < /操作符>





    < /操作符>


    < /操作符>



    < /操作符>


    <列出关键= " function_descriptions " >

    < / >列表
    < /操作符>











    > < /过程
    < /操作符>






    > < /过程
    < /操作符>
    > < /过程
  • earmijoearmijo 成员职位:265独角兽
    谢谢您,马吕斯。我想我要花几天的时间来理解这个过程:-)但它工作得很好。
登录注册置评。