数据挖掘中的数据搜索数据挖掘中的数据搜索

该扩展提供了各种数据搜索和集成方法,用于使用异构表语料库来丰富(扩展)数据表。其中包括对应搜索(针对单个属性的搜索-连接),包括人在循环中的改进、无约束搜索和关联搜索。此扩展的一些运营商需要曼海姆大学开发的数据搜索服务器,该服务器维护公共端点。

这个扩展为数据增强提供了自动化和半自动化的方法,其中包括数据搜索、属性发现和将新属性集成到数据集。

该扩展提供i)单属性数据增强,也称为约束增强或受控数据发现。这将从给定的语料库中发现用户指定的特定属性;ii)多属性数据增强,也称为无约束增强。它从语料库中发现相关属性,并将这些属性增加到给定的数据集。

目前,扩展提供以下操作符:

  • 遗留:一些操作符现在被认为是遗留的,并被其他操作符取代,以使扩展更加独立于任何后端搜索服务器。这些包括:
    • 数据搜索
    • 保险丝
    • Correlation-Based搜索
    • 无约束搜索
  • 单属性增强:该组包括在单个操作符链中一起工作的操作符。
    • 建立对应关系
    • 翻译
    • 先进的融合
  • 多属性增强
    • 通过数据融合来充实表
  • 存储库管理:此组包含用于创建存储库和在其中上传数据的操作符。目前,您可以在您的前提下设置一个数据搜索服务器实例(由曼海姆大学开发)。
    • 创建存储库
    • 数据表上传
    • 数据表上传
  • 数据表搜索:这个组提供对搜索引擎的访问。
    • 谷歌表格搜索

版本2.1.0 (26-04-2019)

  • 数据融合操作符中的两个错误修复。
  • 数据融合在富表中增加的一个参数,以平衡覆盖和精度。
  • 增加了一个新的数据集,一个教程过程和应用程序模板,用于全自动增强。

版本2.0.0 (16-11-2018)

  • 新建操作符创建对应。该算子实现了约束数据增强算法,不依赖于曼海姆数据搜索服务器。
  • 将算子重新排列成新的算子组(遗留算子、单属性增强算子和多属性增强算子)。

版本1.0.1 (30-07-2018)

  • 基于数据融合的新运算符充实表。该运算符实现了不依赖于Mannheim数据搜索服务器的无约束数据增强算法。
  • 新运算符无约束搜索。此操作符依赖于Mannheim数据搜索服务器。
  • 新的操作符基于关联的搜索。此操作符依赖于Mannheim数据搜索服务器。

版本0.2.0 (30-01-2018)

  • 添加了新的组件Connection Manager,可以轻松维护与数据搜索服务器的多个实例或端点的连接。
  • 存储库管理操作员组增加了以下新的操作员来创建存储库和上传数据:
    • 创建存储库
    • 数据表上传
    • 数据表上传

版本0.1.3 (19-10-2017)

  • 新的运营商谷歌表搜索

产品详细信息

版本 魅惑
文件大小 15 MB
下载 10860(今日0)10860下载
供应商 RapidMiner实验室
类别 运营商
发布 4/26/19
最后一次更新 19年4月26日下午4:18
(变化)
许可证 AGPL
产品网站 http://ds4dm.de
评级 0.0星(0)