类别

版本

使用MongoDB连接器

本指南针对RapidMiner Studio 9.3引入的新连接管理。

有关旧的Legacy MongoDB连接,请参阅9.2文档

MongoDB连接器允许您连接到NoSQL数据库MongoDB直接从RapidMiner Studio。它支持所有CRUD操作(创建更新,删除),以及运行更复杂的数据库命令。本文档将指导你如何:

安装NoSQL连接器扩展

首先,你需要安装NoSQL扩展:

连接到MongoDB实例

在使用MongoDB连接器之前,必须配置一个新的MongoDB连接。为此,您需要数据库的连接详细信息(主机名、端口和数据库名)。如果您的MongoDB安装需要身份验证,您还需要有效的凭据。

  1. 在RapidMiner Studio中,右键单击要存储MongoDB连接的存储库并选择新建连接图标创建连接

    你也可以点击连接>新建连接图标创建连接并选择存储库在下面的对话框中。

  2. 为新连接输入一个名称并进行设置连接类型卡桑德拉的图标MongoDB

  3. 点击创建图标创建然后切换到设置页中的编辑连接对话框。

  4. 填写MongoDB服务器的连接细节:

    预配置端口为MongoDB默认使用的端口。注意,MongoDB默认情况下不需要用户身份验证。

    虽然不是必需的,但我们建议通过单击连接测试图标测试连接按钮。如果测试失败,请检查详细信息是否正确。

  5. 点击Save图标保存保存连接并关闭编辑连接对话框。

现在,您可以将新创建的连接与所有MongoDB操作符一起使用!

从MongoDB读取

阅读MongoDBoperator允许从MongoDB集合中读取数据。MongoDB使用JSON格式表示数据,不使用数据库模式。此数据格式可以转换为RapidMiner Studio的本机格式JSON到数据操作符。对于相反的方向,使用数据转换为JSON操作符。

让我们从读取原始JSON数据开始,不进行进一步的转换。

  1. 打开一个新进程新进程图标在RapidMiner Studio。拖动阅读MongoDB运算符过程视图,并将其输出端口连接到进程的结果端口连接条目参数从存储库的Connections文件夹中删除存储库选择器图标旁边的按钮:

    或者,可以将MongoDB连接从存储库拖到流程面板并将生成的运算符与阅读MongoDB操作符。

  2. 中选择MongoDB连接mongodb实例下拉菜单中的操作符参数。

  3. 中选择MongoDB集合集合下拉菜单。它应该用配置好的MongoDB数据库中可用的集合来填充:

  4. 运行运行过程这个过程!在Result Perspective中,您应该看到一个JSON文档集合(前提是所选的集合不是空的)。在我们的示例中,集合包含RapidMiner Studio的交易样本数据集:

转换为单个示例集

现在让我们扩展这个过程,将这个JSON文档集合转换为一个示例集,即转换为与RapidMiner Studio的核心操作符兼容的格式。

  1. 导航到设计透视图,并添加JSON到数据操作符在阅读MongoDB操作符和结果端口:

  2. 运行运行过程过程又来了!在结果透视图中,您应该看到一个包含与前面运行相同数据的示例集:

    现在您可以像使用其他数据源一样使用这个示例集。但是,您可能想知道如何查询MongoDB集合的特定子集。到目前为止,我们一直在查询整个集合。

    MongoDB查询语法的介绍超出了本指南的范围。请向官方询问MongoDB文档MongoDB的深入介绍。但是,为了给您一个概念,让我们最后一次修改这个过程。

    在我们的示例中,MongoDB集合中的JSON文档包含一个名为未来的客户.我们可以指定一个简单的查询条件,要求该字段的值为是的(更改下面的示例以匹配您自己的数据应该很简单)。

  3. 导航到设计透视图,选择阅读MongoDB操作符,并编辑操作符参数named标准

  4. 输入以下简短的JSON文档(查询条件):

  5. 运行运行过程又是这个过程。结果集应该只包含包含属性值的示例未来的客户是的

写入MongoDB

将示例集写入MongoDB集合很容易:加载示例集,将其转换为JSON文档集合,然后将其写入MongoDB。下面的示例说明如何将RapidMiner Studio的一个示例数据集写入一个新的MongoDB集合。

  1. 打开一个新进程新进程图标在RapidMiner Studio。

  2. 拖动虹膜样本数据集数据转换为JSON运算符,以及写MongoDB运算符过程如下面的屏幕截图所示,查看并连接操作符。选择您的MongoDB连接并为新连接输入一个名称集合

    注意,您也可以选择一个现有的集合。MongoDB然后将新的JSON文档添加到这个集合中,而不管文档的结构如何(请记住,MongoDB集合没有静态模式)。

  3. 运行运行过程这个过程!在Result透视图中,你应该看到JSON文档的集合已经被添加到指定的MongoDB集合:

    注意,MongoDB会自动为新添加的文档分配唯一id。因此,多次运行此进程将导致重复的条目。