类别

版本

使用Solr连接器

Solr连接器允许您从Solr服务器读取搜索结果。使用Solr搜索操作员可以运行不同的搜索查询。本文档将指导你如何:

安装Solr扩展

首先,你需要安装Solr扩展:

连接到Solr服务器

在使用Solr连接器之前,必须配置一个新的Solr连接。为此,您需要Solr服务器的连接详细信息。通常,Solr服务器URL以字符串'/ Solr '结束。如果您的Solr服务器需要身份验证,您还需要有效的凭证。

  1. 在RapidMiner Studio中,右键单击要存储Solr连接的存储库并选择新建连接图标创建连接

    你也可以点击连接>新建连接图标创建连接并选择存储库在下面的对话框中。

  2. 输入新连接的名称,并进行设置连接类型Solr图标Solr

  3. 点击创建图标创建然后切换到设置页中的编辑连接对话框。

  4. 填写Solr服务器的连接细节:

    预配置的URL是运行在本地机器上的Solr服务器的默认URL。注意,默认情况下Solr不需要用户身份验证,但是您可以通过选择指定用户名和密码使用身份验证

    虽然不是必需的,但我们建议通过单击连接测试图标测试连接按钮。如果测试失败,请检查详细信息是否正确。

  5. 点击Save图标保存保存连接并关闭编辑连接对话框。

现在可以使用新创建的连接和Solr操作符了!

搜索Solr服务器

对于Solr有两个搜索算子,搜索主任(数据)而且查册主任(文件).的搜索主任(数据)operator允许查询Solr服务器并以数据表的形式获取结果。的查册主任(文件)操作符的工作类似,但将数据作为文档集合提供,这些文档可以用Text扩展名进一步处理。的配置搜索主任(数据)算子,也可以应用到查册主任(文件)

  1. 打开一个新进程新进程图标在RapidMiner Studio中,拖动搜索主任(数据)运算符过程视图,并将其输出端口连接到流程的结果端口:为连接条目参数从存储库的连接文件夹中获取存储库选择器图标旁边的按钮:

    或者,您可以将Solr连接从存储库拖到流程面板并将生成的运算符与读Solr操作符。

  2. 属性的列表中选择一个集合集合参数。

  3. 属性旁边的按钮定义搜索查询查询参数。您可以添加筛选器来优化查询。如果没有参数过滤查询可见点击显示高级参数来展示它。

  4. 属性的数据面等高级参数面向方面的搜索.注意,您可以更改默认值限制为结果的最大数目为100。

  5. 运行运行过程这个过程!在结果透视图中,您可以看到查询产生的表。Solr集合字段现在是列,每一行都来自一个Solr条目。

方法的使用请遵循相同的步骤查册主任(文件)操作符。在指定集合查询您可以选择文档正文字段.该参数指定哪个Solr字段将存储在RapidMiner文档主体中。其他Solr字段成为文档的元数据记录。

现在,每个Solr条目都转换为一个Document,而不是像搜索主任(数据)操作符。

添加到Solr服务器

对于搜索Solr,需要向Solr添加两个操作符。的添加到Solr(数据)将数据表的内容上传到Solr服务器。的添加到Solr(文档)operator的工作原理类似,但期望输入是来自Text扩展的文档集合。

的配置添加到Solr(数据)算子,也可以应用到添加到Solr(文档)

  1. 打开一个新进程新进程图标在RapidMiner Studio中,拖动添加到Solr(数据)运算符过程视图,并按上面所述指定连接。

  2. 属性的列表中选择一个集合集合参数。

  3. 将操作符的输入端口与需要添加的数据表连接起来。每一列都将成为一个Solr字段,每一行都将成为各自字段的Solr条目。

添加到Solr(文档)操作符的工作原理完全相同,只是将Documents的集合作为输入。文档的元数据记录由键和相关值组成。这些键将成为Solr字段,一个Document将使用相关值指定一个Solr条目。由于文档有一个额外的主体,您可以通过参数指定Solr字段文档正文字段