执行Python代码
下面是扩展的基本功能。方法提供的教程过程,请务必探索执行Python也是操作员。其他营办商(Python的学习者而且Python变压器),将于自定义操作符页面。
事情是如何运作的
理解数据如何在RapidMiner操作符和Python脚本扩展提供的操作符之间传输是很重要的。换句话说,当您将任何RapidMiner操作符的端口连接到任何Python操作符(执行Python,Python的学习者,Python变压器).
当将数据传递给Python操作符时,RapidMiner示例集会自动转换为Pandas数据框架。返回的Pandas数据框架rm_main
函数(参见下一章如何构造代码)被Python脚本扩展自动转换回RapidMiner示例集。元数据传播和自动数据类型转换也是双向的。
如何构造代码
为了成功地在RapidMiner中执行Python代码,您需要以声明的方式来构造代码rm_main
作为你的主要入口。的输入参数和返回值的数量和顺序rm_main
函数将对应于的输入和输出端口执行Python操作符。
无论你是使用我们的内联编辑器还是只是嵌入Python脚本或笔记本文件,你都必须遵循这个约定。
运行脚本
您可以通过使用我们的基本脚本编辑器(它提供基本的语法高亮显示,但缺乏Python IDE的所有强大功能)内联编辑Python代码,或者通过在执行Python运营商的脚本文件参数。如果你的脚本存储在一个可以通过互联网访问的位置(如GitHub),你也可以直接从那里读取你的脚本文件打开的文件操作符。
您还可以将脚本文件存储在RapidMiner项目或存储库中。
作为一个方便的特性,如果您将.py或.ipynb文件从项目或存储库拖放到画布上,将自动为您创建正确的操作符。
运行笔记本
你也可以执行ipynb
笔记本的帮助下执行Python.在本例中,使用脚本文件参数,以定位您的笔记本。对于如何构造代码的考虑同样适用于notebook和Python脚本。
如果您标记了您的笔记本单元格,我们提供了基于选择性标记的执行。一种方法是点击显示预览……按钮执行Python操作符(一旦您将笔记本添加到脚本文件参数或将其连接到第一个输入端口),并选择要从执行中排除的单元格。属性中提供正则表达式,从而指定要执行哪些单元格笔记本单元格标签过滤器参数。
使用RapidMiner宏
添加到Python代码中的宏% {myMacro}
语法将在脚本执行之前进行解析,无论是内联脚本还是脚本文件提供的脚本。但是,毫不奇怪,这段代码只会在RapidMiner内部运行,否则会产生语法错误。
另一种更python化的方法是检查启用宏参数执行Python操作符。接下来,您需要向您的rm_main
函数,其中宏将在执行期间可访问。这将允许您不仅读取宏值,还可以定义新的宏值,或覆盖现有宏的值。