安装指南
看到部署文档了解如何将RapidMiner部署为高可用性集群。
推荐使用Kubernetes。如果您更喜欢非kubernetes解决方案,则提供下面的文档。
在本指南中,我们将带您在Linux环境中安装RapidMiner Server作为高可用性集群。它涵盖了在没有现有数据的情况下首次安装RapidMiner Server High Availability。
术语
在本指南中,我们将使用以下术语:
- 安装目录-
为节点上安装RapidMiner Server的目录。 - 共享主目录-<回家>共享RapidMiner Server主目录,集群中的所有节点都可以通过相同的路径访问该主目录。
测试RapidMiner服务器高可用性安装
在部署到生产环境之前,请确保彻底测试您的RapidMiner Server高可用性安装。
- 在部署到生产环境之前,在登台环境中设置和测试RapidMiner Server高可用性。
- 使用与生产实例相同的数据(存储库、用户、扩展)测试RapidMiner Server高可用性。
访问RapidMiner Server高可用性安装
安装完成后,RapidMiner Server的URL将是负载均衡器的URL;这台机器应该被DNS识别为RapidMiner服务器。其余的机器不需要对用户公开访问。
提供共享数据库、共享文件系统和ActiveMQ代理
提供共享数据库
设置共享数据库服务器,并确保数据库允许足够的并发连接。当许多RapidMiner Server节点连接到同一个数据库时,可能很快就会超过默认连接限制。例如,对于PostgreSQL,默认限制是100个连接。如果要增加限制,请编辑postgresql.conf文件并增加的值max_connections
,然后重启PostgreSQL。
提供共享文件系统
设置NFS共享文件系统,确保RapidMiner Server节点可以访问并具有完全的读写权限。
供应ActiveMQ代理
虽然RapidMiner Server集群只使用ActiveMQ的一个实例,但我们强烈建议将其集群化,因为高可用性取决于每个组件的高可用性。您不希望ActiveMQ成为单点故障。为了完整起见,下面概述了单节点设置和集群设置。
单节点ActiveMQ设置
- 下载并安装ActiveMQ。
目前只ActiveMQ 5.14.5版本已测试,并得到官方支持,但请随时测试更新的5。x版本。
如果您使用的是GNU/Linux,您的发行版应该提供ActiveMQ包。您可以轻松地使用包管理器安装它们,并在initd或systemd等系统守护进程的帮助下启动应用程序。
配置将由RapidMiner服务器和作业代理使用的ActiveMQ代理用户:
开放
< activemq-conf-dir > /还
并添加一个新的经纪人用户和密码(例如,用户“brokerUser”,密码“brokerP4ssw0rd”):管理= admin brokerUser = brokerP4ssw0rd
开放
< activemq-conf-dir > /您
并将新用户添加到users组:管理员= admin用户= brokerUser
写下新用户的凭证。需要它们来配置从RapidMiner服务器和从作业代理到代理的连接。
- 启动ActiveMQ。
群集ActiveMQ设置
- 在作为ActiveMQ实例的所有计算机上下载并安装ActiveMQ。
- 在每台机器上安装ActiveMQ实例。要做到这一点,请遵循所描述的任何设置在这里.
- 建议使用共享文件系统主备设置因为您的集群设置已经为RapidMiner Server主目录提供了共享文件系统。
- 请确保所有实例共享相同的代理用户凭证(关于如何设置凭证,请参阅“单节点ActiveMQ设置”)
- 启动所有实例。
准备一个无头安装
为了在节点上安装RapidMiner Server,我们将使用无头安装选项。给出了详细的描述无头安装文档页面。然而,这里有一个关于如何准备无头安装的简短概述:
- 在有UI的机器上下载RapidMiner Server安装程序
- 启动安装程序并选择“在无头机器上安装RapidMiner服务器”选项
- 执行安装程序步骤,并使用适合RapidMiner Server集群设置的配置值
- 使用可达的主机名/IP地址
load_balancer_address
服务器主机名的负载均衡器 - 一定要禁用捆绑作业代理
- 做不启用Radoop代理
- 使用可达的主机名/IP地址
- 最后,生成安装XML文件并将其存储在磁盘上。该文件将用于在节点上安装RapidMiner Server。
准备第一个RapidMiner Server节点
- 提供第一个RapidMiner Server节点的基础结构。您可以通过使用配置管理工具(如Chef或Puppet)或旋转相同的虚拟机快照来实现自动化。
确保RapidMiner Server节点的文件系统支持UTF-8。如果没有,则将以下语句添加到
/etc/environment
配置文件:LC_ALL = en_US。utf - 8LANG=en_US.UTF-8
挂载共享主目录。
例如,让我们假设您的RapidMiner服务器主目录为
/var/rapidminer/application-data rapidminer-server /
您的共享主目录可以作为名为rapidminer-san: / rapidminer-server-home
.添加下面的行到挂载
在每个集群节点上:Rapidminer-san:/rapidminer-server-home /var/rapidminer/application-data/rapidminer-server/ NFS lookupcache=pos,noatime,intr,rsize=32768,wsize=32768 0 0
然后安装它:
Mkdir -p /var/rapidminer/application-data/rapidminer-server/ sudo mount -a
确保所有节点都有同步的时钟和相同的时区配置。下面是一些如何做到这一点的例子:
红帽企业Linux或CentOS:
Sudo yum install NTP Sudo service NTPD start Sudo tzselect . sh
Ubuntu:
Sudo apt-get install NTP Sudo service NTP start Sudo dpkg-reconfigure tzdata . txt
在第一个节点上安装RapidMiner Server
一旦第一个RapidMiner Server节点的基础设施可用并满足所有节点需求,就可以开始安装RapidMiner Server了。
安装RapidMiner Server
- 下载RapidMiner服务器安装程序并解压
- 将无头安装XML文件上传到节点
运行无头安装:
CD
./bin/rapidminer-server-installer .xml
调整配置
安装完成后,您需要调整一些配置来配置RapidMiner Server for High Availability。
首先调整
execution.properties
配置文件以启用集群模式。该文件可以在<回家>共享/配置/
文件夹中。为RapidMiner服务器启用集群模式
rapidminer.server. iscluster = true
将负载均衡器的URL配置为RapidMiner Server的URL,如下所示
Rapidminer.server.protocol = HTTP rapidminer.server.host =
rapidminer.server.port = <端口> 禁用嵌入式ActiveMQ代理,并像这样指向外部代理:
jobservice.queue.activemq.embeddedBroker.enabled = false jobservice.queue.activemq.uri = failover (tcp://172.31.21.116:61616,tcp://172.31.21.112:61616) jobservice.queue.activemq.username = brokerUser jobservice.queue.activemq.password = brokerP4ssw0rd
下一个更新
scheduler.properties
配置文件以启用集群调度器。配置文件与配置文件位于同一文件夹execution.properties
文件。增加如下行:org.quartz.jobStore.isClustered = true org.quartz.jobStore.clusterCheckinInterval = 10000
编辑
standalone.conf
文件位于<安装目录> / bin /
文件夹中。寻找
JAVA_OPTS = " JAVA_OPTS -Djboss.server.log.dir = RAPIDMINER_SERVER_HOME美元/日志”
并将其更改为与实例名匹配的新日志文件夹。例如:
JAVA_OPTS = " JAVA_OPTS -Djboss.server.log.dir = RAPIDMINER_SERVER_HOME美元/日志/ instance1”
另外,添加一个新行,将执行后端指向本地主机就在其他JAVA_OPTS行旁边。例如:
JAVA_OPTS = " $ JAVA_OPTS -Dexecution-backend-url = http://localhost: 8080 /执行”
将RapidMiner Server节点加入负载均衡器
- 启动第一个RapidMiner Server节点
- 打开RapidMiner服务器的Web界面
http (s): / / < load_balancer_address >: <口>
以管理员身份登录 - 确保一切正常(例如加载了扩展,可以检查服务器日志等)。
安装额外的RapidMiner Server节点
一旦第一个RapidMiner Server节点启动并运行,就可以向集群中添加更多节点。有两种方法可以添加更多节点:手动或使用第一个节点的快照。下面将对两者进行描述。但是手动选项需要更多的努力。
手动添加节点
手动添加节点。
- 为其他模式提供基础结构,然后重复中描述的无头安装步骤上面的部分.
你做不需要重新调整整个配置。但不幸的是,每个RapidMiner Server无头安装都会覆盖初始安装的共享配置文件夹。请到
<回家>共享
每次完成无头安装时,都将文件夹和恢复备份配置。例如:CD
./bin/rapidminer-server-installer .xml ### # wait for installation to finish ### CD /var/rapidminer/application-data/rapidminer-server/ # delete new created configuration and replace initial config rm -rf configuration/ mv configuration_backup_9.1.0_2018-11-08_14-40-42/ configuration/ 在文件中配置一个新的日志文件夹
<安装目录> / bin / standalone.conf
,如所述在上面的章节中.- 安装完成并恢复初始配置后,可以通过添加IP地址和端口使新节点作为端点可用
8080
到loadbalance. - 启动新的RapidMiner Server节点
从快照中添加节点
如果您在虚拟基础设施或云中运行RapidMiner Server,我们建议创建初始节点的快照,然后从快照中添加新节点。
这样做:
- 在初始节点上关闭RapidMiner Server
- 创建虚拟实例的快照
- 创建快照后,重新启动初始的RapidMiner Server节点
- 从刚刚创建的快照创建一个新节点
- 的文件中配置一个新的日志文件夹
<安装目录> / bin / standalone.conf
文件如所述在上面的章节中. - 将新节点添加到负载均衡器
- 启动新的RapidMiner Server节点
安装作业代理
每个作业代理都应该安装在专用机器上。您可以从RapidMiner服务器的web界面下载作业代理ZIP文件,也可以调用REST API。我们推荐第二种方法,因为您不必通过SSH将ZIP文件上传到专用的Job Agent机器。使用第二种方法,进行如下操作:
- SSH到运行JobAgent的机器上。
下载JobAgent ZIP文件:
的值获取一个令牌
idToken
字段),即有资格访问下载JobAgent路由的用户,例如admin用户:curl -u admin:PASSWORD http(s)://
:<端口>/api/rest/token服务 下载队列QUEUENAME的ZIP文件。默认队列名为default。注意,名称是区分大小写的。
curl -H "Authorization: Bearer TOKEN_FROM_REQUEST_ABOVE" http(s)://
: /executions/queues/QUEUENAME/agent——output /path/to/save/location/JobAgent.zip
将ZIP文件解压缩到您喜欢的位置。例如:
unzip /path/to/save/location/JobAgent.zip -d /path/to/extract/location
中调整属性
家庭/ config /溶剂进行
根据您的需要归档。ActiveMQ代理URI应该指向已经在execution.properties
RapidMiner Server共享主目录文件。的uri
属性表示一组可用的ActiveMQ实例及其默认端口61616
.例如:jobagent.queue.activemq.uri = failover:(tcp://172.31.21.116:61616,tcp://172.31.21.112:61616) jobagent.queue.activemq.username = brokerUser jobagent.queue.activemq.password = brokerP4ssw0rd
(可选)添加扩展或JDBC驱动程序。
- 启动JobAgent。
恭喜你!
就是这样!RapidMiner服务器在高可用性模式下可以通过如下URL访问:http (s): / / < load_balancer_address >: <口>