需求
本页描述了在高可用性环境中对RapidMiner Server的需求,包括这种设置的组件可能出现的问题。
系统需求
在高可用性环境中,至少存在两个RapidMiner Server节点。每个节点的系统需求都与系统需求用于高可用性环境之外的RapidMiner服务器。
中可能发生的固有死锁MySQL数据库引擎在高负载时,我们不支持它作为RapidMiner服务器高可用性设置的操作数据库。
组件的需求
RapidMiner Server高可用性由一个组件集群组成,每个组件都在一台专用机器上,并通过高速LAN连接。
每个组件都有特定的要求,但只有负载均衡器需要具有公共可访问的URL。RapidMiner Server的URL即负载均衡器的URL;这是在DNS中被识别为RapidMiner服务器的机器。
其余机器(RapidMiner Server节点、作业代理节点、共享数据库、共享文件系统和ActiveMQ代理)不需要对用户公开访问。
RapidMiner服务器节点
RapidMiner Server节点要求如下:
- 每个RapidMiner Server节点必须运行在专用的机器上。机器可以是虚拟的,也可以是物理的。
- 节点必须连接在高速局域网(高带宽,低延迟)。
- 节点不需要完全相同,但为了保持一致的性能,我们建议它们尽可能相似。
- 所有节点必须运行相同版本的RapidMiner Server。
- 所有节点必须具有同步时钟(例如使用NTP),并配置相同的时区。
- 所有节点都必须连接到ActiveMQ代理。
作业代理节点
Job Agent节点的要求如下:
- 每个作业代理节点必须运行在专用机器上。机器可以是虚拟的,也可以是物理的。
- 节点必须连接在高速局域网(高带宽,低延迟)。
- 所有Job Agent节点必须运行相同的版本,与RapidMiner Server版本相匹配。
- 所有节点必须具有同步时钟(例如使用NTP),并配置相同的时区。
- 所有节点都必须连接到ActiveMQ代理。
负载均衡器
我们没有为RapidMiner服务器高可用性捆绑负载均衡器。您可以使用自己选择的负载均衡器。
- 您的负载均衡器必须支持粘性的会话.
- 您的负载均衡器应该在专用机器上运行。
- 您的负载均衡器必须具有到RapidMiner Server节点的高速LAN连接。
- 为了获得最佳性能,强烈建议在负载均衡器上终止SSL (HTTPS),并在负载均衡器和RapidMiner Server之间运行纯HTTP。
我们建议使用HAProxy,它支持所有需要的功能,即开即用。负载均衡器页面描述如何设置HAProxy作为负载均衡器。
共享数据库
共享数据库用于存储配置数据和其他元数据。
- 共享数据库必须运行在专用机器上。
- 共享数据库必须通过高速局域网(必须在同一个物理数据中心)对所有RapidMiner Server节点可用。
- 除了MySQL,所有常用的数据库都被支持。
共享文件系统
RapidMiner Server高可用性需要高性能的共享文件系统,如SAN、NAS、RAID服务器或高性能io优化文件服务器。
- 共享文件系统必须运行在专用机器上。
- 文件系统必须通过高速局域网对所有集群节点可用(它必须位于相同的物理数据中心)。
- 共享文件系统应该可以通过NFS作为单个挂载点访问。
ActiveMQ代理
RapidMiner服务器高可用性需要一个远程ActiveMQ代理,因为捆绑的一个对RapidMiner服务器高可用性不活跃。
- ActiveMQ代理必须在专用机器上运行。
- 目前,只有ActiveMQ 5.14.5版本已经过测试,并得到官方支持,但请随时测试更新的5。x版本。
- 您可以使用独立的ActiveMQ安装或集群安装。