无法使用执行Python操作符从磁盘读取文件

ccrichaccricha 成员职位:9因素二世
2019年6月编辑 帮助

你好,我正在努力更好地了解RM服务器如何与其环境交互。我在RM中使用Execute Python操作符编写了一个日志文件来创建一个测试日志文件。我现在尝试使用不同的Execute Python操作符从磁盘(Linux)读取日志文件,然后使用Store操作符将此数据存储在远程存储库中。所有这些都运行在Linux RM服务器上。

最终发生的是RM写入一个空数据集。当我查看server.log文件时,我看到了这样的多行:

(com.rapidminer.operator警告。(scheduledprocess_1503585018370)读取CSV:无法解析输入中的第0行:com.rapidminer.tools.CSVParseException:值引号未在位置0关闭。最后几个字是:“

以下是我的总体流程:

RM_fileread2.png总体流程RM_fileread1.pngPython代码

数据帧没有正确构造吗?执行Python进程似乎正在某个地方写入一个临时CSV文件,RM试图读取该文件,但没有成功。

标记:

最佳答案

  • ccrichaccricha 成员职位:9因素二世
    解决方案接受

    你好Scott,谢谢你的回复。这主要是在我需要使用更详细的python过程进行更复杂的数据转换时,需要在该脚本中读取/写入数据库等,并且我想使用python的日志模块将日志记录到磁盘。在某些情况下,详细的日志记录是必要的,而RM并不是一个很好的工具。我知道我可以在ExecutePython操作符中成功地从脚本记录到磁盘,并且我最终能够使用“read Document”操作符读取文件,然后将其存储到存储库中。它只是在我看来,虽然这应该仍然工作,因为它是返回一个DataFrame对象,而是抛出一个CSVParseException。无论如何,我将在将来考虑使用“Read Document”来读取和分析日志文件。

    谢谢

    sgenzer

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    @ccricha-很高兴你能来。我想我的第一个问题是为什么你使用python脚本读/写日志文件?RapidMiner内置了非常好的,易于使用的操作符,可以为您完成此操作:

    截图2017-08-24下午1点35分31秒

    我在运行RM服务器的Ubuntu服务器上使用了这些操作符,没有出现任何问题。试一试?

    斯科特

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    @ccricha-好的,这是有道理的,是的,读文档会做得更好,因为它会抓取你的文本文件,而不是CSV,它正在寻找一个结构。祝你好运。

    斯科特

登录注册置评。