类别

版本

您正在查看9.9 -版本的RapidMiner Python文档点击这里查看最新版本

RapidMiner和Python

在这个页面上,我们收集了RapidMiner的所有功能,这些功能可以为那些喜欢在项目中使用(Python)代码的数据爱好者解锁RapidMiner的潜力。我们还将展示您可以将其转变为团队努力的所有方式,与团队中喜欢使用RapidMiner经过验证的创作方法(使用操作符和流程)的其他人进行交互。

从RapidMiner调用Python

作为一个在项目中工作的RapidMiner用户,您经常会发现它非常有用从RapidMiner进程调用Python代码。更进一步,你可以将模型训练或ETL转换“打包”为用Python编写的RapidMiner操作符并将其分发给团队中的其他人。这将在一些典型的场景中派上用场:

  • 您会发现将数据准备步骤或建模步骤编写为Python代码更容易或更方便
  • 您希望重用团队中某人创建的一段Python代码
  • 你想用一个前沿的Python库扩展RapidMiner

从Python调用RapidMiner

当使用Python代码(可能是笔记本)时,您可能希望访问存储在RapidMiner项目和存储库中的数据和元数据调用RapidMiner Studio或RapidMiner AI Hub来运行一些进程。我们提供了一个Python库,它允许你处理任何这些典型的场景:

  • 你想利用RapidMiner存储库或项目中存储和准备的数据
  • 您希望运行RapidMiner内置的进程,并将其输出用作代码中的输入
  • 您希望访问外部数据源,而不需要在代码中处理凭据

RapidMiner笔记本

RapidMiner笔记本提供一个熟悉的基于笔记本的代码创作环境,作为RapidMiner AI Hub的一部分。它允许精通代码的数据科学家和数据工程师以一种熟悉的方式完成他们的工作,同时还支持使用RapidMiner与其他团队成员进行创作和部署的开箱即用协作。RapidMiner笔记本会派上用场的一些典型场景:

  • 你的公司已经采用了RapidMiner AI Hub,你希望继续在笔记本环境中工作
  • 您正在使用RapidMiner项目与其他人协作
  • 您需要使用存储在RapidMiner项目或基于Notebook的项目存储库中的数据集
  • 您需要RapidMiner进程的输出作为基于Notebook的项目的输入

体系结构

这张图解释了在RapidMiner AI Hub中实现Python代码创作和执行集成的高级组件。这些可以在很少或不需要手动配置的情况下启用上面提到的所有用例。

平台管理提供了这样的可能性集中管理编码环境横跨AI Hub,用虚线箭头表示。

其余的箭头代表的可能性RapidMiner从Python代码执行进程使用Python库。

Python脚本扩展启用在产品的各个组件中执行Python代码(RapidMiner Server用于类似web服务的执行,RapidMiner Job Agents用于计划和临时批处理执行)。