您正在查看9.7 -版本的RapidMiner服务器文档点击这里查看最新版本
需求
本页描述了在高可用性环境中对RapidMiner Server的要求,包括这种设置的组件的潜在问题。
系统需求
在高可用性环境中,至少有两个RapidMiner Server节点。每个节点的系统需求都与系统需求在高可用性环境之外的RapidMiner服务器。
类中可能发生的固有死锁MySQL数据库引擎在高负载时,我们不支持它作为RapidMiner服务器高可用性设置的操作数据库。
组件的需求
RapidMiner Server High Availability由一组组件组成,每个组件都在一台专用机器上,并通过高速LAN连接连接。
每个组件都有特定的需求,但只有负载平衡器需要具有可公开访问的URL。RapidMiner Server的URL就是负载均衡器的URL;这是在DNS中标识为RapidMiner服务器的机器。
其余的机器(RapidMiner Server节点、Job Agent节点、共享数据库、共享文件系统和ActiveMQ代理)不需要对您的用户公开访问。
RapidMiner服务器节点
对RapidMiner Server节点的要求如下:
- 每个RapidMiner Server节点必须在专用机器上运行。机器可以是虚拟的,也可以是物理的。
- 节点必须连接在高速局域网(高带宽,低延迟)上。
- 节点不需要完全相同,但为了保持一致的性能,我们建议它们尽可能相似。
- 所有节点必须运行相同版本的RapidMiner Server。
- 所有节点必须具有同步时钟(例如,使用NTP),并配置相同的时区。
- 所有节点必须连接到ActiveMQ代理。
作业代理节点
请注意Job Agent节点的以下要求:
- 每个Job Agent节点必须在专用计算机上运行。机器可以是虚拟的,也可以是物理的。
- 节点必须连接在高速局域网(高带宽,低延迟)上。
- 所有Job Agent节点必须运行相同的版本,与RapidMiner Server版本匹配。
- 所有节点必须具有同步时钟(例如,使用NTP),并配置相同的时区。
- 所有节点必须连接到ActiveMQ代理。
负载均衡器
我们没有为RapidMiner服务器高可用性绑定负载均衡器。您可以使用自己选择的负载平衡器。
- 您的负载平衡器必须支持粘性的会话.
- 您的负载平衡器应该在专用机器上运行。
- 您的负载均衡器必须具有到RapidMiner服务器节点的高速LAN连接。
- 为了获得最佳性能,强烈建议在负载平衡器上终止SSL (HTTPS),并在负载平衡器和RapidMiner Server之间运行纯HTTP。
我们建议使用HAProxy,它支持开箱即用的所有必需功能。负载均衡器页面描述了如何将HAProxy设置为负载均衡器。
共享数据库
共享数据库用于存储配置数据和其他元数据。
- 共享数据库必须在专用计算机上运行。
- 共享数据库必须通过高速LAN对所有RapidMiner Server节点可用(它必须位于相同的物理数据中心)。
- 支持所有常用的数据库,除了MySQL。
共享文件系统
RapidMiner Server High Availability需要一个高性能的共享文件系统,例如SAN、NAS、RAID服务器,或者I/O优化的高性能文件服务器。
- 共享文件系统必须在专用计算机上运行。
- 文件系统必须通过高速LAN对所有集群节点可用(它必须位于相同的物理数据中心)。
- 共享文件系统应该可以通过NFS作为单个挂载点进行访问。
ActiveMQ代理
RapidMiner服务器高可用性需要一个远程ActiveMQ代理,因为绑定的代理对于RapidMiner服务器高可用性来说不是活动的。
- ActiveMQ代理必须在专用机器上运行。
- 目前,只有ActiveMQ版本5.14.5已经过测试,并正式支持,但请随时测试更多更新5。x版本。
- 您可以使用独立的ActiveMQ安装或集群安装。