RapidMiner和Python
在这个页面上,我们收集了所有的特性,这些特性为喜欢在项目中使用(Python)代码的数据爱好者释放了RapidMiner的潜力。我们还将展示所有方法,您可以将此转化为团队工作,与您的团队中喜欢使用RapidMiner经过验证的创作方法(使用操作符和进程)的其他人进行交互。
从RapidMiner调用Python
作为一个在项目中工作的RapidMiner用户,您经常会发现它很有用从RapidMiner进程调用Python代码.更进一步,你可以“打包”你的模型训练或ETL转换写在Python作为一个RapidMiner操作符并将其分发给团队中的其他人。一些典型的场景,这将派上用场:
- 你会发现用Python代码编写数据准备步骤或建模步骤更容易或更方便
- 你想重用团队中某人创建的一段Python代码
- 你想用一个前沿的Python库来扩展RapidMiner
从Python调用RapidMiner
当使用Python代码(可能是笔记本电脑)时,您可能希望访问存储在RapidMiner项目和存储库中的数据和元数据,这可能对调用RapidMiner Studio或RapidMiner AI Hub来运行一些进程.我们提供了一个Python库,允许您处理以下任何典型场景:
- 您希望利用在RapidMiner存储库或项目中存储和准备的数据
- 你想运行一个内置在RapidMiner中的进程,并将其输出作为代码的输入
- 您希望访问外部数据源,而不需要在代码中处理凭证
RapidMiner笔记本
RapidMiner笔记本作为RapidMiner AI Hub的一部分,提供了一个熟悉的基于笔记本的代码创作环境。它允许精通代码的数据科学家和数据工程师以熟悉的方式进行工作,同时还支持与其他团队成员使用RapidMiner进行创作和部署的开箱即用协作。一些典型的场景,RapidMiner笔记本将派上用场:
- 你的公司已经采用了RapidMiner AI Hub,你希望继续在笔记本环境中工作
- 您正在使用RapidMiner项目与他人协作
- 您需要为基于Notebook的项目使用存储在RapidMiner项目或存储库中的数据集
- 您需要一个RapidMiner进程的输出作为基于Notebook的项目的输入
体系结构
该图解释了在RapidMiner AI Hub中一起实现Python代码创作和执行集成的高级组件。这些用例只需要很少或不需要手动配置就可以实现上面提到的所有用例。
平台管理提供了集中管理编码环境穿过AI Hub,由虚线箭头所示。
其余的箭头表示的可能性从Python代码执行RapidMiner进程使用Python库。
Python脚本扩展使Python代码在产品的各个组件中执行(RapidMiner服务器用于类似web服务的执行,RapidMiner作业代理用于计划和临时批处理执行)。