您正在查看9.3 -版本的RapidMiner服务器文档点击这里查看最新版本
可伸缩的架构
要为数据科学团队构建RapidMiner Server环境,必须安装两个组件:乐鱼平台进入
- RapidMiner服务器-中心部分
- 工作代理人-本地或远程,以提供可扩展性
再加上以下助手应用程序:
- RapidMiner工作室-设计将在RapidMiner服务器环境中运行的进程
- 数据库—用于存储配置文件、cron作业详细信息、用户报告请求和其他支持数据
可安装以下可选组件,独立运行:
- 实时计分代理-提供低延迟web服务的可扩展性
下面显示了一个简单的示意图。

设计
RapidMiner服务器环境的设计反映了典型的数据科学工作流,其中有两种活动:乐鱼平台进入
模型构建,涉及可以放在队列上并异步运行的长时间运行流程
RapidMiner服务器为长时间运行的作业提供队列系统,这些作业通过工作代理人。通过添加Job Agents可以提高处理能力。
预测,或模型的任何其他应用,其中需要实时响应是至关重要的
有两种生成预测的引擎:
只有后者是可扩展的。通过添加实时计分代理,可以提高处理能力。
RapidMiner服务器
RapidMiner服务器是该体系结构的核心组件。您可以通过web界面或RapidMiner Studio与它进行交互。其主要职责是:
- 用户,队列,以及权限管理
- 调度用户作业(进程)
- 执行通过web服务/ web应用调用的进程
- 在本地作业代理(如果存在)上运行的进程的执行
- 库管理(模型、流程等的存储及其权限)
- 连接管理(DB、Hadoop/Radoop等)
阅读更多:安装RapidMiner Server
在下面的图表中,每个蓝框代表一台单独的机器。RapidMiner服务器安装在左边的蓝色大框上,而右边的蓝色框上的主机是远程Job Agents。

工作代理人
Job Agents在专用机器上远程运行的设计旨在提高可伸缩性。然而,一个或多个工作代理可以是安装在本地,与RapidMiner Server在同一台机器上。
每个作业代理都配置为指向RapidMiner服务器上的一个队列。它的唯一职责是从队列中挑选作业,并通过生成作业容器来运行它们。对于每个作业代理,可以生成的作业容器的数量和可用内存都是可配置的。
多个作业代理可以指向同一个队列。你可以管理队列,从而通过分配权限来分配资源。乐鱼体育安装
阅读更多:安装作业代理
工作容器
由作业代理生成的作业容器运行一个执行进程的RapidMiner Studio实例。该过程完成后,作业容器终止。因为每个作业都在自己的沙箱中运行,所以系统非常健壮;一份工作的问题对其他工作没有影响。
安全性的代价是延迟——生成作业容器的延迟以秒为单位。如果实时响应不是最重要的,那么这种延迟就不重要了,但如果是,我们建议使用web服务或实时计分代理。例如,您可以在作业容器中构建一个模型,并通过实时评分代理为该模型生成预测。
实时计分代理
如前所述,有两种生成预测的引擎:
当生成预测通过实时计分代理,你需要RapidMiner服务器创建部署,但一旦安装,它独立于RapidMiner服务器运行。
如下表所示,实时计分代理是作业代理/作业容器的可伸缩、低延迟的对应物。简而言之,这正是你需要的实时预测。
组件 | 可伸缩的 | 低延迟 |
---|---|---|
作业代理/作业容器 | ![]() |
![]() |
实时计分代理 | ![]() |
![]() |
Web服务 | ![]() |
![]() |
阅读更多:Web服务
阅读更多:实时得分