"[已解决]遍历文件(从第一行提取id)"

earmijo · 2012年5月

亲爱的专家:

我有大约2000个文本文件与以下结构:
第一行:客户id后面跟着一个冒号
接下来的k行:客户交易数据(x1,x2,x3,x4)

——file01.txt ------------------
01：
* 13, x11, x12 x14
将,x21 x23 x24
．....
xk1、xk2 xk3 xk4
——file02.txt -------------------
02:
* 13, x11, x12 x14
将,x21 x23 x24
．....
xk1、xk2 xk3 xk4
——file03.txt -------------------
03:
* 13, x11, x12 x14
将,x21 x23 x24
．....
xk1、xk2 xk3 xk4
——file04.txt --------------------
04:
* 13, x11, x12 x14
将,x21 x23 x24
．....
xk1、xk2 xk3 xk4

我想要的是将它们合并到一个包含以下列的文件中

id, x1, x2, x3, x4

有一个简单的方法来做它在RapidMiner?

提前感谢，

\埃内斯托

MariusHelf · 2012年5月

当然你可以用RapidMiner来做

请查看附件的流程。它使用Loop Files操作符遍历所有文件。它逐行读取它们，使用Extract Macro提取第一行，删除第一行，然后用逗号分隔其余行。

最好的
马吕斯

<？xml version="1.0" encoding="UTF-8" standalone="no"?>
<过程version = " 5.2.003 " >
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文










<列出关键= "注释" / >

<列出关键= " data_set_meta_data_information " >

< / >列表
< /操作符>





< /操作符>


< /操作符>



< /操作符>


<列出关键= " function_descriptions " >

< / >列表
< /操作符>











> < /过程
< /操作符>






> < /过程
< /操作符>
> < /过程

earmijo · 2012年5月

谢谢您，马吕斯。我想我要花几天的时间来理解这个过程:-)但它工作得很好。

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

"[已解决]遍历文件(从第一行提取id)"

答案