类别

版本

搜索Solr(数据)(Solr)

剧情简介

这个操作符搜索Solr条目并生成一个示例集。

描述

要连接到Solr服务器,必须指定一个Solr连接。这包括Solr服务器的URL和用于身份验证的可选用户/密码组合。通常,Solr服务器URL以字符串'/ Solr '结尾。

下一步是在服务器上选择一个集合。集合可以想象成一张表。它由几个列组成,这些列被称为Solr字段。Solr字段有一个类型(例如数字)和一个键(列的名称)。Solr中的每个条目都可以想象成一行,并包含各自字段的值。

RapidMiner示例集具有非常相似的结构。它也可以想象成一张桌子。因此,Solr的每一行都被添加为RapidMiner中的行。Solr集合字段用作RapidMiner属性。

要搜索Solr,必须指定一个查询字符串。您可以添加过滤器来优化查询。例如,如果您不想接收属性键为“popularity”且值为“6”的物品,则使用“!popularity:6”。接收条目的范围可以通过属性offset和rows来设置。您可以指定使用哪个字段对接收到的条目进行排序。也可以启用切面。分面搜索将搜索结果分成多个类别。使用“facet fields”和“date facets”来指定要进行面处理的Solr字段。

如果Solr字段支持多个元素,则以JSON数组的形式提供相关值。

输入

  • 连接(连接)

    这个输入端口需要一个Connection对象(如果有的话)。有关更多信息,请参阅参数连接项。

输出

  • 输出(数据表)

    该端口提供主要的搜索结果。它由一个示例集组成。

  • 方面(数据表)

    该端口用于提供分面搜索的结果。提供了一个示例集,其中包含字段名、找到的值和出现的次数。

  • 连接(连接)

    这个输出端口从输入端口传递Connection对象。如果输入端口未连接,则端口不发送任何内容。

参数

  • connection_source此参数指示应该如何指定连接。它提供了两个选项,预定义和存储库。参数是不可见的连接输入端口已连接。选择范围:
  • connection_entry此参数仅在连接源参数设置为存储库。此参数用于指定表示连接项的存储库位置。也可以使用连接输入端口。范围:字符串
  • 连接此参数仅在连接源参数设置为预定义的。必须指定Solr连接的连接细节。如果已经配置了Solr连接,可以从下拉列表中选择。如果尚未配置Solr连接,请选择下拉列表右侧的图标。在Manage connections对话框中创建一个新的Solr连接。Solr服务器URL是必需的。此外,您可以指定用于身份验证的用户名/密码组合。范围:可配置的
  • 集合提供Solr集合的名称,必须使用它来访问数据。范围:字符串
  • 查询要搜索的词。范围:字符串
  • filter_query一个过滤器,它不影响相关性评分,这是默认排序顺序。有了这个字段,您可以优化您的查询。例如,如果字段名必须包含John,但不能包含Doe,则可以使用'name:John -name:Doe'。范围:字符串
  • 抵消要获取的第一个文档索引。范围:整数
  • 限制结果的最大数目。范围:整数
  • 排序如果对搜索结果进行排序,则指定。范围:布尔
  • sort_fieldSolr字段,用于排序。范围:字符串
  • sort_order结果的排序顺序。选择范围:
  • faceted_search如果使用分面搜索,则指定。范围:布尔
  • categorical_facets用于分面搜索的面。范围:枚举
  • date_facets用于分面搜索的日期切面。单个日期方面由字段名、开始日期、结束日期和间隔组成。范围:枚举
  • include_generated_fields如果自动生成的字段包含在搜索结果中,则指定。这些字段可以由SolrCloud字段组成,也可以基于动态Solr字段。范围:布尔