类别

版本

您正在查看9.2 -版本的RapidMiner服务器文档点击这里查看最新版本

需求

本页描述了在高可用性环境中对RapidMiner Server的要求,包括这种设置的组件的潜在问题。

系统需求

在高可用性环境中,至少有两个RapidMiner Server节点。每个节点的系统需求都与系统需求在高可用性环境之外的RapidMiner服务器。

类中可能发生的固有死锁MySQL数据库引擎在高负载时,我们不支持它作为RapidMiner服务器高可用性设置的操作数据库。

组件的需求

RapidMiner Server High Availability由一组组件组成,每个组件都在一台专用机器上,并通过高速LAN连接连接。

每个组件都有特定的需求,但只有负载平衡器需要具有可公开访问的URL。RapidMiner Server的URL就是负载均衡器的URL;这是在DNS中标识为RapidMiner服务器的机器。

其余的机器(RapidMiner Server节点、Job Agent节点、共享数据库、共享文件系统和ActiveMQ代理)不需要对您的用户公开访问。

RapidMiner服务器节点

对RapidMiner Server节点的要求如下:

  • 每个RapidMiner Server节点必须在专用机器上运行。机器可以是虚拟的,也可以是物理的。
  • 节点必须连接在高速局域网(高带宽,低延迟)上。
  • 节点不需要完全相同,但为了保持一致的性能,我们建议它们尽可能相似。
  • 所有节点必须运行相同版本的RapidMiner Server。
  • 所有节点必须具有同步时钟(例如,使用NTP),并配置相同的时区。
  • 所有节点必须连接到ActiveMQ代理。

作业代理节点

请注意Job Agent节点的以下要求:

  • 每个Job Agent节点必须在专用计算机上运行。机器可以是虚拟的,也可以是物理的。
  • 节点必须连接在高速局域网(高带宽,低延迟)上。
  • 所有Job Agent节点必须运行相同的版本,与RapidMiner Server版本匹配。
  • 所有节点必须具有同步时钟(例如,使用NTP),并配置相同的时区。
  • 所有节点必须连接到ActiveMQ代理。

负载均衡器

我们没有为RapidMiner服务器高可用性绑定负载均衡器。您可以使用自己选择的负载平衡器。

  • 您的负载平衡器必须支持粘性的会话
  • 您的负载平衡器应该在专用机器上运行。
  • 您的负载均衡器必须具有到RapidMiner服务器节点的高速LAN连接。
  • 为了获得最佳性能,强烈建议在负载平衡器上终止SSL (HTTPS),并在负载平衡器和RapidMiner Server之间运行纯HTTP。

我们建议使用HAProxy,它支持开箱即用的所有必需功能。负载均衡器页面描述了如何将HAProxy设置为负载均衡器。

共享数据库

共享数据库用于存储配置数据和其他元数据。

  • 共享数据库必须在专用计算机上运行。
  • 共享数据库必须通过高速LAN对所有RapidMiner Server节点可用(它必须位于相同的物理数据中心)。
  • 支持所有常用的数据库,除了MySQL。

共享文件系统

RapidMiner Server High Availability需要一个高性能的共享文件系统,例如SAN、NAS、RAID服务器,或者I/O优化的高性能文件服务器。

  • 共享文件系统必须在专用计算机上运行。
  • 文件系统必须通过高速LAN对所有集群节点可用(它必须位于相同的物理数据中心)。
  • 共享文件系统应该可以通过NFS作为单个挂载点进行访问。

ActiveMQ代理

RapidMiner服务器高可用性需要一个远程ActiveMQ代理,因为绑定的代理对于RapidMiner服务器高可用性来说不是活动的。

  • ActiveMQ代理必须在专用机器上运行。
  • 目前,只有ActiveMQ版本5.14.5已经过测试,并正式支持,但请随时测试更多更新5。x版本。
  • 您可以使用独立的ActiveMQ安装或集群安装。