类别

版本

体系结构概述

本页描述了RapidMiner服务器高可用性设置中的组件。

RapidMiner服务器节点

对于高可用性,您至少需要两个RapidMiner Server节点。RapidMiner Server的每个节点是完全独立的。不需要跨节点通信。

作业代理节点

作业代理节点运行已经提交给RapidMiner Server集群的进程。对于高可用性,您需要确保至少有两个Job Agent指向每个队列,这样,如果一个Job Agent发生故障,队列上的作业可以由另一个Job Agent接起。

负载均衡器

负载均衡器作为用户和RapidMiner服务器集群之间的链接。所有对RapidMiner服务器的请求都要经过负载均衡器;它决定哪个RapidMiner服务器节点将响应每个特定的请求。用户可以通过RapidMiner Studio、RapidMiner Server的web UI、BI应用程序等与集群联系。负载均衡器对于用户和客户端应用程序是完全透明的。需要配置会话保持。任何支持保持会话的第三方负载平衡器都是兼容的。

共享数据库

共享数据库是必需的,因为它存储Repository元数据、用户管理设置和其他配置。应该将数据库配置为高可用性,以防止它成为单点故障。

共享文件系统

高性能共享文件系统(如NFS)是必需的,因为Repository和其他配置存储在RapidMiner服务器主目录.它也应该配置为高可用性。

外部ActiveMQ代理

ActiveMQbroker将RapidMiner服务器与外部作业代理连接起来。有关高可用性,请阅读安装指南