类别

版本

RapidMiner服务器概述

RapidMiner Server是一个性能优化的应用服务器,您可以在其中调度和运行分析过程并快速返回结果。它不仅与RapidMiner Studio无缝集成,还与其他企业数据源无缝集成,允许流程不断更新,以反映外部数据源的任何更改。通过共享存储库和版本管理,整个组织的贡献者可以(本地或远程)协作,构建交互式应用程序,并使用HTML5图表和地图将结果可视化。

理解一般基础设施

RapidMiner服务器配置有几个主要组件:

组件 描述
RapidMiner工作室 RapidMiner Studio是您构建和编辑分析过程的地方。RapidMiner Studio和RapidMiner Server使用标准协议相互连接和交互。对于RapidMiner Server的每个实例,您可以连接一个或多个RapidMiner Studio客户端。
RapidMiner服务器 虽然它是一个单独的应用程序,需要单独的许可证,但RapidMiner Server依赖于RapidMiner Studio进行操作。虽然您可以从RapidMiner服务器运行进程,但如果您想编辑或更改进程,则必须通过RapidMiner Studio进行更改。RapidMiner服务器使用主目录作为服务器配置和存储库内容的中心位置。
RapidMiner作业代理 作业代理负责在部署它们的节点上编排执行。代理运行并连接到队列后,只要队列上有进程可用,它就会启动作业容器。
RapidMiner作业容器 作业容器负责执行流程。它们的生命周期由启动它们的作业代理管理。
RapidMiner服务器存储库 也可以从RapidMiner Studio访问RapidMiner服务器存储库包含RapidMiner Server进程和数据。该内容存储在主目录RapidMiner服务器。
数据源 单个用户数据源,例如,用于模型构建的那些数据源。连接可以让你连接数据库连接到其他数据源.最佳实践建议同时配置RapidMiner Server和RapidMiner Studio来访问数据源。在使用操作符构建流程时,使用到数据源的连接读数据库编写Amazon S3
操作数据库 RapidMiner服务器数据库(模式)存储配置文件、cron作业详细信息、创建报告请求的用户数据库和其他RapidMiner内部数据。您可以使用现有的数据库服务器或创建一个新的数据库服务器;它可以驻留在本地或远程主机上。安装说明提供一个例子创建PostgreSQL数据库模式。)

RapidMiner Studio和RapidMiner Server通过HTTP(S)进行通信;必须在配置中的每个实例上分配和打开通信端口。尽管对任何配置都适用,但在多个客户机的情况下,访问权限管理对于防止未经授权的用户访问存储库尤为重要。

RapidMiner服务器和作业代理

RapidMiner服务器将执行(不包括通过Web服务触发的执行)外包给一个称为作业代理的外部实体。它通过创建允许这些代理连接到的异步队列来实现这一点。代理通过这些队列接收进程消息,并在请求时发回关于自身状态、正在执行的进程状态和进程日志的信息。一个工作容器在每个进程执行之前生成,这些容器作为独立的OS进程运行在它们自己的JVM中。一旦进程完成执行,JVM就会终止。要了解更多关于职业中介的信息,您可以阅读页面安装>作业代理,或阅读README.md代理分发中的文件。

作业代理不会拾取现有的执行,以防它们意外宕机并重新启动。这些执行必须由管理员手动终止。

使用RapidMiner服务器存储库

与本地RapidMiner Studio存储库一样,RapidMiner Server存储库包含进程和数据。该内容存储在主目录RapidMiner服务器。一些细节:

  • 当你打开服务器回购的RapidMiner服务器存储库存储库RapidMiner Studio的视图,平台协作,使数据和过程可用于两个应用程序。

  • 您可以在RapidMiner Studio中创建进程,然后将它们保存到服务器回购RapidMiner服务器存储库。这两个平台都可以使用。

  • 这些进程引用数据源,这些数据源可以直接存在于RapidMiner Server存储库中,也可以由操作符中使用的连接引用。

  • 使用RapidMiner Server存储库的方法与使用RapidMiner Studio本地存储库的方法相同,不过,如果拥有正确的权限,用户可以共享内容。

连接到数据源

您可以在RapidMiner服务器上定义连接并分配适当的访问权限,而不是为每个用户单独配置这些连接。RapidMiner Studio下载本地用户可用的所有数据库和其他连接服务器回购RapidMiner服务器存储库。

RapidMiner Studio直接访问数据源,并且必须通过任何本地防火墙访问数据。RapidMiner Server可以直接或通过RapidMiner Studio访问数据源,也需要防火墙访问。

RapidMiner Studio和RapidMiner Server都需要有用于数据库连接的JDBC驱动程序。如果您使用的驱动程序没有与RapidMiner软件打包,请在两个平台上都安装它。

看到创建连接部分详细信息。

连接到操作数据库

看到安装说明有关建立操作数据库的详细信息。但是请注意,操作数据库还需要JDBC驱动程序,您可以在安装过程中配置该驱动程序。如果您使用的驱动程序没有与RapidMiner软件打包,请确保在RapidMiner Studio上也安装了该驱动程序。