体系结构概述
本页描述了RapidMiner服务器高可用性设置中的组件。
RapidMiner服务器节点
对于高可用性,您至少需要两个RapidMiner Server节点。RapidMiner Server的每个节点是完全独立的。不需要跨节点通信。
作业代理节点
作业代理节点运行已经提交给RapidMiner Server集群的进程。对于高可用性,您需要确保至少有两个Job Agent指向每个队列,这样,如果一个Job Agent发生故障,队列上的作业可以由另一个Job Agent接起。
负载均衡器
的负载均衡器作为用户和RapidMiner服务器集群之间的链接。所有对RapidMiner服务器的请求都要经过负载均衡器;它决定哪个RapidMiner服务器节点将响应每个特定的请求。用户可以通过RapidMiner Studio、RapidMiner Server的web UI、BI应用程序等与集群联系。负载均衡器对于用户和客户端应用程序是完全透明的。需要配置会话保持。任何支持保持会话的第三方负载平衡器都是兼容的。
共享数据库
共享数据库是必需的,因为它存储Repository元数据、用户管理设置和其他配置。应该将数据库配置为高可用性,以防止它成为单点故障。
共享文件系统
高性能共享文件系统(如NFS)是必需的,因为Repository和其他配置存储在RapidMiner服务器主目录.它也应该配置为高可用性。