如何从本地存储库读取数据?

DDresenDDresen 成员职位:10贡献我
嘿,

我使用'store'操作符将csv文件存储到我的本地存储库中。一切都很好,当我使用“检索”操作符,它可以访问创建的文件,就像它应该是。但是,当我使用“执行python”操作符时,代码试图通过点击“复制位置到剪贴板”从本地存储库中的文件复制的路径读取。csv,它说该文件不存在。我如何通过'execute python'操作符访问文件?
如果我可以通过将'retrieve'操作符连接到'execute python'来访问它-我如何在python代码中调用'retrieve'的输出?


标记:

最佳答案

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3314年RM数据科学家
    @DDresen

    历史上(在RM 9.7之前),RapidMiner使用它自己的序列化格式(.ioo)。这是用java代码编写的,不可能用其他系统或编程语言读取这些文件(或者不容易)。您需要使用写csv操作符,然后读取csv。

    这在9.7中有所改变。在9.7中,我们将表的序列化格式从。ioo更改为。rmhdf5tables。Hdf5是我们用来存储的标准文件格式。使您的用例更简单。
    我们在hdf5中存储数据的方式与pandas所期望的有点不同。如果我没记错的话,你需要使用我们自己的python库。

    @tkenez你能帮我解释一下细节吗?

    ~马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    DDresen
登录注册置评。