Python脚本扩展

RapidMiner提供了Python脚本扩展,包括营运人执行Python.它使您能够在RapidMiner进程中运行Python代码。

ExampleSets被处理为熊猫DataFrame对象。

该扩展支持各种Python环境管理工具,包括流行的水蟒分布和virtualenvwrapper

安装与配置

必要的安装和配置根据您希望安装扩展的位置而有所不同。阅读下面更多的安装和配置扩展:

完成上述步骤后,您应该拥有一个能够运行随工具提供的任何教程过程的环境执行Python操作符

使用

以下是该扩展的一些关键特性。中提供的教程过程执行Python操作员也是。

要成功地在RapidMiner中执行代码,您需要以声明的方式构建代码rm_main作为你的主要切入点。的输入参数和返回值的数量和顺序rm_main函数的输入和输出端口对应执行Python操作符。

运行脚本

您可以通过使用我们的基本脚本编辑器(它提供基本的语法高亮显示,但缺乏Python IDE的所有强大功能)对其进行内联编辑来执行Python代码,或者在执行Python运营商的脚本文件参数。如果你的脚本存储在一个可以通过互联网访问的位置(比如GitHub),你也可以直接从那里读取你的脚本文件打开的文件操作符。

运行笔记本

你也可以执行ipynb笔记本的帮助执行Python.在这种情况下,使用脚本文件参数的操作员定位您的笔记本。关于如何构建代码的考虑同样适用于笔记本和Python脚本。

如果您标记了您的笔记本单元格,我们将提供基于标记的选择性执行,允许您选择要从执行中排除哪些单元格。或者,您可以通过提供正则表达式来指定要执行的单元格。

微调执行

Python环境是消除包依赖污染和不同项目之间的干扰的好方法。在这种情况下,您可能会使用多个Python环境。

要自定义一个特定的Execute Python操作符中使用的Python环境,您只需要取消选中即可使用默认Python在操作符参数中,并在其中提供所需的Python环境。与RapidMiner Studio首选项中相同的选项可用(请参阅上面的安装和配置章节)。

使用RapidMiner宏

添加到Python代码中的宏% {myMacro}语法将在脚本执行之前被解析,无论是内联脚本还是脚本文件提供的脚本。但是,毫不奇怪,这段代码只会在RapidMiner内部运行,否则会产生语法错误。

另一种更python的解决方法是检查启用宏参数在执行Python操作符上。接下来,您需要向您的rm_main函数,在执行过程中可以访问其中的宏。这样不仅可以读取宏值,还可以定义新的宏值,或者覆盖现有宏的值。

在服务器上运行

在RapidMiner服务器上运行Execute Python操作符时,只有几个特殊的注意事项需要考虑,否则一切都将按预期工作。

在使用环境管理器(如Anaconda)时,最好在Studio和Server上安装具有相同名称的相同环境。

为了使提供用于web服务和常规进程执行的相同Python环境变得容易和无错误,您应该使用我们的平台管理工具

当在RapidMiner Studio中打开Execute Python操作符时,只会列出本地Python环境,而不会列出RapidMiner Server上存在的环境,即使进程是从服务器存储库打开的。