类别

版本

您正在查看9.7 -版本的RapidMiner服务器文档点击这里查看最新版本

RapidMiner服务器概述

RapidMiner Server是一个性能优化的应用服务器,您可以在其中调度和运行分析过程并快速返回结果。它不仅与RapidMiner Studio无缝集成,还与其他企业数据源无缝集成,允许流程不断更新,以便将任何更改反映到外部数据源。通过共享存储库和版本管理,整个组织的贡献者可以本地或远程协作,构建交互式应用程序,并使用HTML5图表和地图可视化结果。

了解一般基础设施

RapidMiner服务器配置有几个主要组件:

组件 描述
RapidMiner工作室 RapidMiner Studio是您构建和编辑分析过程的地方。RapidMiner Studio和RapidMiner Server采用标准协议相互连接和交互。对于RapidMiner Server的每个实例,您可以连接一个或多个RapidMiner Studio客户端。
RapidMiner服务器 虽然它是一个独立的应用程序,需要一个单独的许可证,但RapidMiner Server依赖于RapidMiner Studio进行操作。虽然你可以从RapidMiner Server运行一个进程,但如果你想编辑或更改一个进程,你必须通过RapidMiner Studio进行这些更改。RapidMiner服务器使用一个主目录作为服务器配置和存储库内容的中心位置。
RapidMiner作业代理 作业代理负责在部署它们的节点上编排执行。在代理运行并连接到队列之后,只要队列上有进程可用,它就会启动作业容器。
RapidMiner作业容器 作业容器负责执行进程。它们的生命周期由启动它们的Job Agent管理。
RapidMiner服务器存储库 也可以从RapidMiner Studio访问RapidMiner服务器存储库包含RapidMiner服务器进程和数据。对象中存储此内容主目录的RapidMiner服务器。
数据源 单个用户数据源,例如,用于模型构建的数据源。连接允许你连接数据库连接到其他数据源。最佳实践建议您配置RapidMiner Server和RapidMiner Studio以访问数据源。在使用诸如。等操作符构建流程时,使用到数据源的连接读数据库写Amazon S3
操作数据库 RapidMiner服务器数据库(模式)存储配置文件、cron作业详细信息、创建报告请求的用户数据库和其他内部RapidMiner数据。您可以使用现有的数据库服务器或创建一个新的;它可以驻留在本地或远程主机上。(安装说明提供一个例子创建PostgreSQL数据库模式。)

RapidMiner Studio和RapidMiner Server通过HTTP(S)通信;必须在配置中分配并打开每个实例上的通信端口。尽管对于任何配置都是如此,但在多个客户机的情况下,访问权限管理对于防止未经授权的用户访问存储库尤为重要。

RapidMiner服务器和作业代理

RapidMiner服务器将执行(不包括通过Web服务触发的执行)外包给一个称为Job Agent的外部实体。它通过创建允许这些代理连接到的异步队列来实现这一点。代理通过这些队列接收进程消息,并发回关于它们自己的状态、它们正在执行的进程的状态和处理日志(如果请求)的信息。一个工作容器在每个进程执行之前生成,这些容器作为独立的操作系统进程在它们自己的JVM中运行。一旦进程完成执行,JVM就会终止。要了解更多关于职业中介的信息,你可以阅读这个页面“安装>作业代理”,或阅读README.md文件中的代理分发。

作业代理不拾取现有的执行,以防它们意外地下降并再次启动。这些执行必须由管理员手动终止。

使用RapidMiner服务器存储库

RapidMiner Server存储库与本地RapidMiner Studio存储库一样,包含进程和数据。对象中存储此内容主目录的RapidMiner服务器。一些细节:

  • 当你打开服务器回购中的RapidMiner服务器存储库存储库在RapidMiner Studio的视图中,平台协作,使数据和过程对两个应用程序都可用。

  • 在RapidMiner Studio中创建进程,然后将它们保存到服务器回购RapidMiner服务器存储库。它们在两个平台上都可用。

  • 这些进程引用数据源,这些数据源可以直接存在于RapidMiner Server存储库中,也可以由操作符中使用的连接引用。

  • 使用RapidMiner Server存储库的方式与使用RapidMiner Studio本地存储库的方式相同,尽管另外,通过正确的权限,用户可以共享内容。

连接到数据源

您可以在RapidMiner Server上定义连接并分配适当的访问权限,而不是为每个用户单独配置这些连接。RapidMiner Studio下载所有可用的数据库和其他连接到本地用户打开服务器回购RapidMiner服务器存储库。

RapidMiner Studio直接访问数据源,并且必须通过任何本地防火墙访问数据。RapidMiner Server可以直接访问数据源,也可以通过RapidMiner Studio访问数据源,并且还需要防火墙访问。

RapidMiner Studio和RapidMiner Server都需要有用于数据库连接的JDBC驱动程序。如果您使用的驱动程序没有随RapidMiner软件打包,请在两个平台上都安装它。

看到创建连接部分查看完整的详细信息。

连接到操作数据库

看到安装说明有关设置操作数据库的详细信息。但是,请注意,操作数据库还需要一个JDBC驱动程序,您可以在安装过程中配置它。确保如果您使用的驱动程序不是与RapidMiner软件一起打包的,那么您也可以在RapidMiner Studio上安装驱动程序。