类别

版本

您正在查看9.9 -版的RapidMiner Studio文档点击这里查看最新版本

连接到数据

要成为有效的数据科学工具,RapidMin乐鱼平台进入er Studio必须首先连接到您的数据。

  • 如果数据在计算机上的文件中,RapidMiner Studio必须读取文件格式
  • 如果数据在数据库RapidMiner Studio必须连接到该数据库,并知道该数据库的语言(SQL / NoSQL)。
  • 如果数据在, RapidMiner Studio必须连接到云服务并了解其API。
  • 如果数据导入或导出到其他软件工具,例如Python, RapidMiner Studio必须知道这个工具。
  • 如果连接是通过a代理或者一个自签名SSL证书, RapidMiner Studio必须克服这一障碍。

好消息是,RapidMiner Studio支持广泛的文件格式、数据库、云服务等软件工具,无论是本地的还是通过的扩展

连接对象

a的概念连接对象在RapidMiner Studio 9.3中引入。

你可以将遗留连接转换为连接对象

当通过网络连接到您的数据时,必须首先创建一个连接对象。连接对象允许连接到数据库,或电子邮件服务。的存储库中存储所有连接对象连接文件夹图标连接子文件夹。

从现在开始,我们就直接给他们打电话连接,但要记住它们与宇宙中的其他物体有相似之处存储库。例如,您可以将数据库连接拖到Process Panel中以检索在将输出连接到读数据库操作符。

要创建连接,请右键单击连接文件夹图标连接文件夹,然后选择创建连接图标创建连接。的创建连接对话框打开,您可以配置连接。如果您正在连接到SQL数据库

  1. 选择连接类型DB连接图标数据库),存储库(将存储连接的位置)和连接名
  2. 新闻创建连接图标创建编辑连接对话框打开。
  3. 设置选项卡,选择数据库系统然后填充用户密码宿主港口,以及(可选的)数据库名字
  4. 新闻测试连接图标测试连接。一旦它开始工作,Save图标保存连接。该连接将出现在 连接文件夹图标 连接 在步骤(1)中选择的存储库的子文件夹。

您可以通过双击Repository Panel中的连接,或者右键单击连接并选择,随时查看连接详细信息打开图标开放打开图标编辑

注入参数:共享连接

连接对象可以共享。

假设一组用户可以访问相同的数据库,并且他们进行协作RapidMiner AI Hub。他们可以在不共享用户名和密码的情况下共享数据库连接吗?答案是是的

解决方案是将连接构建为模板,其中所有公共参数都是预先填充的,每个用户的所有参数都是唯一的注射。的值注入参数不存储在连接对象中,而是在每次使用连接时从外部源检索。可能的外部来源包括和安全存储RapidMiner AI Hub

在RapidMiner AI Hub存储库中创建一个连接,或者将连接复制到RapidMiner AI Hub存储库,用户必须属于连接管理器组。看到共享和权限

总之,假设数据库凭据将安全地存储在RapidMiner AI Hub上,那么使用连接模板的整个过程可能如下所示。我们将调用用户连接管理器的角色管理

  1. 在RapidMiner Studio中管理创建一个连接RapidMiner AI Hub存储库。虽然可以在本地存储库中创建连接,但该连接只能提供作为注射源。

  2. 在编辑连接时,管理按下按钮注入参数图标设置注入参数并选择稍后将留空的参数(例如User和Password)。管理员还必须选择RapidMiner AI Hub作为注入值的来源。

  3. 要设置注入的值,请使用用户必须连接到RapidMiner AI Hub的web界面。中显示的链接编辑连接对话框

    或者直接连接到web界面,然后导航到存储库>连接,并通过名称识别连接。警告说:这个连接缺少值。用户单击链接,填写自己的用户名和密码,然后按下按钮保存在RapidMiner AI Hub,凭据将安全地保存在其中。步骤(3)需要每个用户重复。

要了解更多细节,请阅读RapidMiner AI Hub文档创建连接用法与注射

宏作为注入参数的来源

在RapidMiner Studio中,可以立即使用进程宏中的值进行连接设置。编辑连接时,按注入参数图标设置注入参数并选择应该从宏中获取值的参数。然后,宏名称需要匹配参数键才能注入该值。参数键可以在参数旁边的信息中找到。

宏源的配置是可选的。如果不配置前缀,宏名必须匹配参数键。如果给出了配置的前缀,宏名必须匹配前缀后面的下划线(_),以参数key结束。对于前缀myprefix参数键用户是否需要宏名称

myprefix_user

应该使用的宏将在设置注入时显示,以及在视图和编辑对话框中显示。

使用此命令将宏正确地注入到连接中。

占位符

占位符可以在任何配置参数的值中使用,以引用其他参数。可以连接占位符和自由文本。不支持嵌套占位符。

因为占位符的语法与for相同,重要的是要弄清楚上下文:

  • 宏的上下文是流程
  • 占位符的上下文是连接

占位符可以从当前选项卡访问参数值,也可以从任何其他选项卡访问参数值。要查找希望通过其他字段中的占位符引用的字段的键,请查看原始字段的信息工具提示。的完整的关键就是你要找的:

要在另一个字段中使用此占位符,只需在另一个字段中引用完整键,并在其周围加上百分号()和大括号({}),像这样:

% {db_config.database}

如果无法解析占位符,则简单地将其替换为空字符串,但仍将其视为注入值,并且不会使流程执行失败。

基于JDBC的数据库连接使用这种机制从参数创建URL。

如果没有参数信息,URL由几个占位符和一个双冒号组成。通过设置参数,这些值将被替换。

完全像这样使用占位符系统来配置动态参数值。