类别

版本

Radoop代理

Radoop Proxy允许您通过位于安全Hadoop集群边缘的一台机器来隧道所有Radoop连接。它的目的是显著减少需要在保护Hadoop集群的防火墙上开放的端口数量,使网络配置更加容易。

Radoop Proxy架构

Radoop Proxy是一个可以通过多种方式方便地发布的组件:

  • 捆绑与RapidMiner服务器
  • 作为一个独立Docker容器(可以作为独立实例使用,也可以作为RapidMiner服务器部署的一部分)

它可以接受来自RapidMiner Studio的连接,并将这些连接转发到Hadoop,形成到集群的单个访问点。它通常安装在一个安全的集群机器上(可以是现有的Hadoop节点,也可以是专用的机器/边缘节点),因此它与集群节点位于同一个本地网络上。若要允许外部访问受保护的集群,只需使用少量港口需要在防火墙上打开,制作默认网络设置过时了。

为保证安全性,RapidMiner Studio用户在使用Radoop Proxy时需要进行身份验证。身份验证由连接到Radoop代理的RapidMiner服务器完成,或者使用独立的用户名/密码组合(取决于Radoop代理配置)。

RapidMiner Studio用户和Radoop Proxy之间的连接可以很容易SSL安全如果托管代理的机器的证书可用。因为两个RapidMiner服务器用户Hadoop用户可以在一个中央LDAP服务器中进行管理,这也实现了集中和方便的用户管理。

建立Radoop代理连接

  1. 确保网络需求(主机名解析,防火墙规则)到位,Radoop代理安装在Hadoop集群网络内的节点上。

  2. 创建一个新的Radoop代理连接来自RapidMiner Studio属于您选择的任何本地或远程存储库。设置选项卡上的字段解释如下:

    描述
    Radoop代理服务器主机 Radoop Proxy服务器的IP地址或主机名
    Radoop代理服务器端口 Radoop代理服务器端口。默认值是1081
    使用企业单点登录 使用来自父存储库的Enterprise SSO令牌。仅与存储库面板中的Radoop代理连接一起显示。应该只与配置了SAML/Keycloak认证的Radoop代理服务器一起使用,明白吗自定义安装Radoop代理获取详细信息。RapidMiner服务器用户而且RapidMiner服务器密码在使用此特性时禁用。
    RapidMiner服务器用户 鉴权用户名。当以下情况时禁用此选项使用企业单点登录检查。
    RapidMiner服务器密码 用于连接的密码。当以下情况时禁用此选项使用企业单点登录检查。
    使用安全(SSL)连接 使用SSL进行代理连接。看到Radoop代理安全获取详细信息。如果你的证书不知名,你需要填写密钥存储库文件而且密钥存储库的密码
    密钥存储库文件(SSL) 包含要使用的SSL证书的Keystore文件,如果证书是众所周知的,则可以将此文件留空。当以下情况时禁用此选项使用安全(SSL)连接没有启用。
    密钥存储库密码(SSL) 用于解锁密钥存储库的密码,如果密钥存储库没有密码,则可以将此密码保留为空。当以下情况时禁用此选项使用安全(SSL)连接没有启用。
  3. 连接菜单中,选择编辑数据连接图标管理Radoop连接,点击编辑您的连接配置,而在Radoop代理选项卡检查使用Radoop代理

  4. 属性中的第一个下拉选择器中选择代理定义的位置Radoop代理连接部分。选择本地存储库用于在Studio中建立连接,或用于远程连接的Server存储库名称。

  5. 中的第二个下拉选择器中选择连接Radoop代理连接部分。在服务器位置的情况下,您可能需要单击刷新按钮刷新按钮来同步从服务器到Studio的连接。您还可以选择单击编辑按钮编辑按钮可以在此屏幕上编辑现有的或创建新的Radoop代理连接。