类别

版本

在RapidMiner AI Hub上安装RapidMiner Radoop

本文档假设已经部署了RapidMiner AI Hub使用容器化部署方法,并且在存储库或项目中有可用的工作Radoop连接,如配置Radoop连接。在其他情况下,请咨询本文档的上一个版本

先决条件

在RapidMiner AI Hub中使用RapidMiner Radoop之前,必须满足以下要求:

  • RapidMiner Radoop扩展在RapidMiner Studio中安装和测试。
  • 一个工作的Radoop连接到RapidMiner Studio中的Hadoop集群,存储在存储库或项目中。看到配置RapidMiner Radoop连接去学习如何创造它。
  • 与RapidMiner AI Hub中安装的RapidMiner Radoop扩展相同的版本。(容器化部署附带了捆绑的Radoop扩展,因此您只需要确保版本匹配。)
  • 在RapidMiner AI Hub中安装的RapidMiner Radoop的有效许可证。你可以拿到驾照了从您的RapidMiner帐户门户

在RapidMiner AI Hub和连接的Job Agent上安装RapidMiner Radoop

由于在使用我们的容器化部署时,AI Hub中已经有了Radoop扩展,因此唯一需要的步骤是安装上面获得的Radoop许可证。

为此,以管理员身份登录到AI Hub,然后单击安装许可证采取行动管理->管理许可证页面并粘贴您的Radoop许可密钥。

使用RapidMiner AI Hub的Radoop连接

在RapidMiner AI Hub中使用Radoop连接与RapidMiner Studio一样简单,但是有一些注意事项将在下面详细讨论。在RapidMiner AI Hub中执行的RapidMiner进程所使用的Radoop连接必须位于相同的存储库或项目中。

重要提示:RapidMiner AI Hub web服务不支持Radoop进程。

使用RapidMiner AI Hub执行管理多个Hadoop用户

当多个用户在RapidMiner AI Hub中运行Radoop进程时,自然会期望Radoop在Hadoop集群上创建的作业都作为单个用户运行,以进行可审计性。

还期望使用Kerberos保护这些集群,并使用keytab进行身份验证,每个用户都有自己的keytab。

通过使用RapidMiner AI Hub的保险库来安全地存储每个用户的这些密钥标签,可以直接从保险库创建使用每个用户自己的密钥标签的连接。

为此,为其他用户设置连接的连接管理器或管理员必须编辑导出的Radoop连接,然后单击设置注入参数安全选项卡并选择要从RapidMiner AI Hub注入的Kerberos keytab参数。

注意:RapidMiner AI Hub注入选项仅在Radoop连接存储在RapidMiner AI Hub项目时可用。不支持遗留存储库。

注意:管理员必须确保每个用户在RapidMiner AI Hub中都有一个有效的keytab注入到他们的用户库中。这项任务可以使用RapidMiner AI Hub的REST api来完成,如果使用脚本自动执行,则会容易得多。如果需要,请联系我们的支持团队提供示例脚本。

使用Radoop代理与RapidMiner AI Hub执行

当在RapidMiner AI Hub上执行进程时,Radoop Proxy会自动禁用,因为在典型设置中,RapidMiner AI Hub在安全区域内运行,因此不需要通过Radoop Proxy路由流量。

如果不是这种情况,并且RapidMiner AI Hub实例确实需要Radoop Proxy来访问Hadoop集群,则需要调整Radoop连接以支持此场景:

  1. 打开管理Radoop连接窗口并编辑导出到存储库或项目的原始Radoop连接。

  2. RapidMiner AI Hub选项卡,检查在AI Hub上强制Radoop代理

  3. 保存,然后出口到存储库或项目的连接。

注意:Radoop连接和Radoop Proxy连接必须位于相同的存储库或项目中,并且两者都需要位于将发生执行的相同AI Hub上。