使用python读取几个Rapidminer示例集

frasaufrasau 成员职位:9学我
大家好!
我是Rapidminer的初学者。

我在rapidminer上创建了一个循环,从我pc上的一个文件夹中读取一系列csv文件。
加载的exampleesets只有两列。
对于其中一列,我想用Python计算较大的值。

如何做到这一点呢?

目前我在Python上写了一个代码,只读取这些csv文件:< br >< br >
open(r' c:\Users\FR\Desktop\First.csv')为文件:
对于文件中的行:< br >< br >
Item = int(line)< br >< br >
list.append(项)


结果= []


对于range(len(list)中的I:< br >
A = lista[i-1]< br >< br >
B = lista[i]< br >< br >
C = lista[i+1]< br >< br >
如果b >= a, b >= c:< br >< br >
results.append (b)< br >< br >
打印(结果)< br >< br >有没有办法不对每个文件重复此代码?< br >
标记:

答案

  • btamasbtamas 员工,成员职位:11RM团队成员
    2020年6月编辑
    嗨frasau,< br >< br >如果你把你的过程贴在这里,也许有人会给你更具体的建议。只需将进程xml复制到post中。如果你没有使用Python脚本扩展中的Execute Python操作符,我强烈建议使用它。使用Execute Python操作符,你可以处理pandas DataFrame。您还必须在代码中定义rm_main方法。像这样的东西应该可以达到目的:< br >< br >
    进口熊猫 < br > def rm_main (df): < br > ,,Df ["c"] = Df。应用(λx: x [a]如果x [a] > [b]其他x [b],轴= 1)< br > ,,返回df


    希望这能有所帮助!
    hbajpai frasau lionelderkrikor
  • frasaufrasau 成员职位:9学我
    非常感谢@btamas!!!!
登录注册置评。