类别

版本

查册主任(文件)(Solr)

剧情简介

该操作符搜索Solr条目,并为每个结果生成一个文档。

描述

要连接到Solr服务器,必须指定一个Solr连接。这包括Solr服务器的URL和用于身份验证的可选用户/密码组合。通常,Solr服务器URL以字符串'/ Solr '结束。

下一步是在服务器上选择一个集合。集合可以想象成一个表。它由几列组成,这些列称为Solr字段。一个Solr字段有一个类型(例如数字)和一个键(列的名称)。可以将Solr中的每个条目想象为一行,并包含各自字段的值。

RapidMiner文档有一组元数据记录,由一个键和一个相关值组成。元数据键被映射到Solr属性。RapidMiner文档有一个额外的主体。因此,您可以选择一个Solr字段,其内容将存储在RapidMiner文档体中。

要搜索Solr,必须指定一个查询字符串。您可以添加筛选器来优化查询。例如,如果你不想接收属性键为“popularity”且值为“6”的项目,则使用“!popularity:6”。接收的条目范围可以通过属性偏移量和行来设置。您可以指定使用哪个字段对接收到的条目进行排序。也可以启用侧面。分面搜索将搜索结果分成多个类别。使用“facet fields”和“date facets”来指定用于facet的Solr字段。

如果一个Solr字段支持多个元素,相关的值将以JSON数组的形式提供。

输入

  • 连接(连接)

    这个输入端口需要一个Connection对象(如果有的话)。有关更多信息,请参阅参数连接条目。

输出

  • 输出(集合)

    此端口提供主要搜索结果。它由一系列文件组成。

  • 方面(数据表)

    该端口用于提供分面搜索的结果。提供了一个示例集,其中包含字段名称、找到的值以及出现的次数。

  • 连接(连接)

    这个输出端口从输入端口传递Connection对象。如果输入端口未连接,则该端口不传递任何信息。

参数

  • connection_source此参数指示应如何指定连接。它提供了两个选项,预定义的和存储库。参数不可见连接输入端口已连接。选择范围:
  • connection_entry时,此参数有效连接源参数设置为存储库.此参数用于指定表示连接项的存储库位置。方法也可以提供连接连接输入端口。范围:字符串
  • 连接时,此参数有效连接源参数设置为预定义的.必须指定Solr连接的连接详细信息。如果您已经配置了一个Solr连接,您可以从下拉列表中选择它。如果您还没有配置Solr连接,请选择下拉列表右侧的图标。在管理连接对话框中创建一个新的Solr连接。Solr服务器URL是必需的。此外,您还可以指定用户名/密码组合进行身份验证。范围:可配置的
  • 集合提供必须用于访问数据的Solr集合的名称。范围:字符串
  • 查询要搜索的术语。范围:字符串
  • document_body_fieldSolr字段,用作RapidMiner文档主体。范围:字符串
  • filter_query一个过滤器,它不会影响相关性得分,相关性得分是默认的排序顺序。有了这个字段,您可以细化您的查询。例如,如果字段名必须包含John,但不能包含Doe,你可以使用'name:John -name:Doe'。范围:字符串
  • 抵消要获取的第一个文档索引。范围:整数
  • 限制结果的最大数目。范围:整数
  • 排序指定搜索结果是否已排序。范围:布尔
  • sort_field用于排序的Solr字段。范围:字符串
  • sort_order结果的排序顺序。选择范围:
  • faceted_search指定是否使用面搜索。范围:布尔
  • categorical_facets用于分面搜索的方面。范围:枚举
  • date_facets用于面搜索的日期面。单个日期面由字段名、开始日期、结束日期和间隔组成。范围:枚举
  • include_generated_fields指定搜索结果中是否包含自动生成的字段。这些字段可以由SolrCloud字段组成,也可以基于动态Solr字段。范围:布尔