类别

版本

需求

本页描述了在高可用性环境中对RapidMiner Server的需求,包括这种设置的组件可能出现的问题。

系统需求

在高可用性环境中,至少存在两个RapidMiner Server节点。每个节点的系统需求都与系统需求用于高可用性环境之外的RapidMiner服务器。

中可能发生的固有死锁MySQL数据库引擎在高负载时,我们不支持它作为RapidMiner服务器高可用性设置的操作数据库。

组件的需求

RapidMiner Server高可用性由一个组件集群组成,每个组件都在一台专用机器上,并通过高速LAN连接。

每个组件都有特定的要求,但只有负载均衡器需要具有公共可访问的URL。RapidMiner Server的URL即负载均衡器的URL;这是在DNS中被识别为RapidMiner服务器的机器。

其余机器(RapidMiner Server节点、作业代理节点、共享数据库、共享文件系统和ActiveMQ代理)不需要对用户公开访问。

RapidMiner服务器节点

RapidMiner Server节点要求如下:

  • 每个RapidMiner Server节点必须运行在专用的机器上。机器可以是虚拟的,也可以是物理的。
  • 节点必须连接在高速局域网(高带宽,低延迟)。
  • 节点不需要完全相同,但为了保持一致的性能,我们建议它们尽可能相似。
  • 所有节点必须运行相同版本的RapidMiner Server。
  • 所有节点必须具有同步时钟(例如使用NTP),并配置相同的时区。
  • 所有节点都必须连接到ActiveMQ代理。

作业代理节点

Job Agent节点的要求如下:

  • 每个作业代理节点必须运行在专用机器上。机器可以是虚拟的,也可以是物理的。
  • 节点必须连接在高速局域网(高带宽,低延迟)。
  • 所有Job Agent节点必须运行相同的版本,与RapidMiner Server版本相匹配。
  • 所有节点必须具有同步时钟(例如使用NTP),并配置相同的时区。
  • 所有节点都必须连接到ActiveMQ代理。

负载均衡器

我们没有为RapidMiner服务器高可用性捆绑负载均衡器。您可以使用自己选择的负载均衡器。

  • 您的负载均衡器必须支持粘性的会话
  • 您的负载均衡器应该在专用机器上运行。
  • 您的负载均衡器必须具有到RapidMiner Server节点的高速LAN连接。
  • 为了获得最佳性能,强烈建议在负载均衡器上终止SSL (HTTPS),并在负载均衡器和RapidMiner Server之间运行纯HTTP。

我们建议使用HAProxy,它支持所有需要的功能,即开即用。负载均衡器页面描述如何设置HAProxy作为负载均衡器。

共享数据库

共享数据库用于存储配置数据和其他元数据。

  • 共享数据库必须运行在专用机器上。
  • 共享数据库必须通过高速局域网(必须在同一个物理数据中心)对所有RapidMiner Server节点可用。
  • 除了MySQL,所有常用的数据库都被支持。

共享文件系统

RapidMiner Server高可用性需要高性能的共享文件系统,如SAN、NAS、RAID服务器或高性能io优化文件服务器。

  • 共享文件系统必须运行在专用机器上。
  • 文件系统必须通过高速局域网对所有集群节点可用(它必须位于相同的物理数据中心)。
  • 共享文件系统应该可以通过NFS作为单个挂载点访问。

ActiveMQ代理

RapidMiner服务器高可用性需要一个远程ActiveMQ代理,因为捆绑的一个对RapidMiner服务器高可用性不活跃。

  • ActiveMQ代理必须在专用机器上运行。
  • 目前,只有ActiveMQ 5.14.5版本已经过测试,并得到官方支持,但请随时测试更新的5。x版本。
  • 您可以使用独立的ActiveMQ安装或集群安装。