您正在查看9.4 -版本的RapidMiner Studio文档点击这里查看最新版本
连接到数据
要成为有效的数据科学工具,RapidMin乐鱼平台进入er Studio必须首先连接到您的数据。
- 如果数据在计算机上的文件中,RapidMiner Studio必须读取文件格式.
- 如果数据在数据库RapidMiner Studio必须连接到该数据库,并知道该数据库的语言(SQL / NoSQL)。
- 如果数据在云, RapidMiner Studio必须连接到云服务并了解其API。
- 如果数据导入或导出到其他软件工具,例如Python或表, RapidMiner Studio必须知道这个工具。
- 如果连接是通过a代理或者一个自签名SSL证书, RapidMiner Studio必须克服这一障碍。
好消息是,RapidMiner Studio支持广泛的文件格式、数据库、云服务等软件工具,无论是本地的还是通过的扩展.
连接对象
a的概念连接对象在RapidMiner Studio 9.3中引入。
你可以将遗留连接转换为连接对象.
当通过网络连接到您的数据时,必须首先创建一个连接对象.连接对象允许连接到数据库,云,或电子邮件服务。的存储库中存储所有连接对象连接子文件夹。
从现在开始,我们就直接给他们打电话连接,但要记住它们与宇宙中的其他物体有相似之处存储库.例如,您可以将数据库连接拖到Process Panel中以检索在将输出连接到读数据库操作符。
要创建连接,请右键单击连接文件夹,然后选择创建连接.的创建连接对话框打开,您可以配置连接。如果您正在连接到SQL数据库:
- 选择连接类型(数据库),存储库(将存储连接的位置)和连接名.
- 新闻创建和编辑连接对话框打开。
- 下设置选项卡,选择数据库系统然后填充用户,密码,宿主,港口,以及(可选的)数据库名字
- 新闻测试连接.一旦它开始工作,保存连接。该连接将出现在
连接 在步骤(1)中选择的存储库的子文件夹。
您可以通过双击Repository Panel中的连接,或者右键单击连接并选择,随时查看连接详细信息开放或编辑.
注入参数:共享连接
连接对象可以共享。
假设一组用户可以访问相同的数据库,并且他们进行协作RapidMiner服务器.他们可以在不共享用户名和密码的情况下共享数据库连接吗?答案是是的!
解决方案是将连接构建为模板,其中所有公共参数都是预先填充的,每个用户的所有参数都是唯一的注射.的值注入参数不存储在连接对象中,而是在每次使用连接时从外部源检索。可能的外部来源包括宏和安全存储RapidMiner服务器.
来在RapidMiner服务器存储库中创建连接,或者要将连接复制到RapidMiner Server存储库,用户必须属于连接管理器组。看到共享和权限.
总之,假设数据库凭据将安全地存储在RapidMiner Server上,那么使用连接模板的整个过程可能如下所示。我们将调用用户连接管理器的角色管理.
在RapidMiner Studio中管理创建一个连接RapidMiner服务器存储库.虽然可以在本地存储库中创建连接,但该连接只能提供宏作为注射源。
在编辑连接时,管理按下按钮设置注入参数并选择稍后将留空的参数(例如User和Password)。管理员还必须选择RapidMiner Server作为注入值的来源。
要设置注入的值,请使用用户必须连接到RapidMiner服务器的web界面。中显示的链接编辑连接对话框
或者直接连接到web界面,然后导航到存储库>连接,并通过名称识别连接。警告说:这个连接缺少值.用户单击链接,填写自己的用户名和密码,然后按下按钮保存在RapidMiner服务器,凭据将安全地保存在其中。步骤(3)需要每个用户重复。
要了解更多细节,请阅读RapidMiner服务器文档创建连接和用法与注射.
宏作为注入参数的来源
在RapidMiner Studio中,可以立即使用进程宏中的值进行连接设置。编辑连接时,按设置注入参数并选择应该从宏中获取值的参数。然后,宏名称需要匹配参数键才能注入该值。参数键可以在参数旁边的信息中找到。
宏源的配置是可选的。如果不配置前缀,宏名必须匹配参数键。如果给出了配置的前缀,宏名必须匹配前缀后面的下划线(_
),以参数key结束。对于前缀myprefix参数键用户是否需要宏名称
myprefix_user
应该使用的宏将在设置注入时显示,以及在视图和编辑对话框中显示。
使用此命令将宏正确地注入到连接中。
占位符
占位符可以在任何配置参数的值中使用,以引用其他参数。可以连接占位符和自由文本。不支持嵌套占位符。
因为占位符的语法与for相同宏,重要的是要弄清楚上下文:
- 宏的上下文是流程.
- 占位符的上下文是连接.
占位符可以从当前选项卡访问参数值,也可以从任何其他选项卡访问参数值。要查找希望通过其他字段中的占位符引用的字段的键,请查看原始字段的信息工具提示。的完整的关键就是你要找的:
要在另一个字段中使用此占位符,只需在另一个字段中引用完整键,并在其周围加上百分号(%
)和大括号({}
),像这样:
% {db_config.database}
如果无法解析占位符,则简单地将其替换为空字符串,但仍将其视为注入值,并且不会使流程执行失败。
基于JDBC的数据库连接使用这种机制从参数创建URL。
如果没有参数信息,URL由几个占位符和一个双冒号组成。通过设置参数,这些值将被替换。
完全像这样使用占位符系统来配置动态参数值。