类别

版本

设计视图

看到也视频介绍到RapidMiner GUI。

RapidMiner Studio是预测性分析的可视化工作流设计器,为分析团队的每个人带来数据科学和机器学习。乐鱼平台进入

当你从事任何类型的新项目时,第一步通常是在白板上,在那里你将计划工作流程并确定实现目标的关键步骤。如果你是一名数据科学家,工作流程通常包括以下一个或多个步骤:

  • 导入数据
  • 准备数据
  • 建立一个模型
  • 验证模型
  • 应用模型

RapidMiner Studio在软件中实现了您的白板工作流设计视图.设计视图包括许多面板

  • 数据、过程和结果存储在存储库
  • 每个工作流的基本元素都被调用运营商
  • 操作员通过港口.第一个的输出作为输入传递给第二个。
  • 帮助您转换和分析数据的一组连接的操作符称为过程
  • 操作符的行为可以通过更改参数
  • 操作符的行为可以通过阅读帮助

下面将更详细地讨论这些术语。

默认视图

过程

流程:一组连接的操作符,帮助您转换和分析数据。

又称:流程、程序、管道、图表

你的目标是创建一个完成的过程,产生结果的一组连接的操作符。例如,您的流程可能读取一个数据集并构建一个预测模型。当你把你所有的运营商并设置自己的参数,按下运行运行箭头按钮,结果将显示在结果视图

讨论了在运行一个进程,有不止一种方式来运行您的进程。你可以运行它:

随着流程规模的增长,您将需要一些方法来管理它们的复杂性。

将您的过程保存到存储库中,选择文件>保存过程从主菜单。

你可以通过先将进程导出到一个XML文件来轻松地共享它:

  • 要导出流程,请选择文件>出口流程.导出对话框允许您将文件保存为.rmp. xml;实际上,这两种文件格式是相同的(XML)。
  • 要导入流程,请选择文件>导入过程

港口

要构建流程,必须连接每个流程的输出操作符到下一个的输入通过a港口.要连接两个端口,请单击它们。悬停一个端口可以看到带有附加信息的工具提示。在连接两个操作符时,需要确保第一个操作符的输出端口与第二个操作符的输入端口兼容,否则将收到错误消息。每个Operator的输入和输出端口在Operator中进行了描述帮助,而完整的端口列表载于开始词汇表

如果你想看结果结果视图,您必须将进程中的最后一个Operator连接到进程面板右侧的结果端口(“res”)。

提示:双击输出端口,它将连接到下一个可用的结果(“res”)端口。

下面的例子展示了一个简单的过程,其中(1)读取Excel文件中的数据,(2)存储在存储库,(3)显示在结果视图中。

一个简单的过程

下面的截图显示了一个更复杂的过程,由汽车模型

更复杂的过程

存储库

存储库:您的中心数据存储实体。它在本地或远程保存连接、数据、过程和结果。

也称为:文件夹、工作区、项目

当使用RapidMiner Studio工作时,您需要一个地方来保存您的工作。的存储库可用于存储:

  • 连接
  • 数据
  • 流程
  • 结果
  • 任意文件(从RapidMiner Studio 9.7开始)

注意,在RapidMiner 9.7中,的概念存储库有几种不同的类型:

遗产库 对于RapidMiner Studio 9.6和更早的版本,这是标准的存储库,没有版本控制和有限的文件类型集。您不能创建遗留存储库,但您仍然可以使用以前创建的任何遗留存储库,或者迁移他们到一个新的存储库。

一个远程存储库on RapidMiner AI Hub是仍然这种类型的。
远程存储库 RapidMiner AI Hub的每个实例都有和仍有一个独特的中央存储库,与RapidMiner Studio的遗留库具有相同的特征:没有版本控制和有限的文件类型集。
存储库(本地) 从RapidMiner Studio 9.7开始,本地存储库支持任意文件类型,但不支持版本控制。这种类型的存储库在RapidMiner AI Hub上没有对应的存储库。

当您在存储库中双击一个非rapidminer文件时,它将在该文件类型的标准应用程序中打开。当您将一个非rapidminer文件拖到流程面板时,一个打开的文件操作符创建。扩展,例如Python脚本扩展,可以提供额外的功能,因此将Python脚本拖到Process Panel中会创建一个执行Python操作符。
项目 在RapidMiner Studio 9.7中,a项目支持版本控制和任意文件类型。它的行为方式与Repository相同,但增加了版本控制。

如项目文档中所述RapidMiner工作室而且RapidMiner AI中心,一个项目总是同时具有本地组件和服务器组件,这两个组件是定期同步

存储库是存储您的连接和过程(文件>保存过程);是否将数据、结果或其他文件保存在Repository中取决于您的用例。

首先,您的数据可能存在于文件或数据库中。RapidMiner Studio提供了许多运营商帮助您导入数据,例如,读取Excel读数据库.要启动Import Data向导,请单击导入数据,或选择文件>导入数据从主菜单。

给定数据和过程,您的结果总是可以重新生成的,但可能有很好的理由将结果存储在一个Repository中:

  • 如果结果是一个基于大型数据集的复杂模型,重新生成它将需要时间。
  • 如果你在RapidMiner AI Hub上运行一个进程,你将需要将结果存储(使用商店操作员),因为RapidMiner AI Hub没有等价的结果视图在RapidMiner工作室。

绑定存储库

对于新用户和有经验的用户来说,与RapidMiner Studio捆绑的知识库都是非常宝贵的资源。它们提供了大量的样本数据集和样本流程,以及解释性说明。

  • 培训资源乐鱼体育安装知识库是一组大型数据集和流程,是作为在线培训课程和课程的配套而设计的RapidMiner学院.我们鼓励您利用这些免费课程来练习您的技能。
  • 样品存储库包含额外的数据集和过程,包括下面的时间序列示例样品>时间序列
  • 社区样本存储库是数据集和过程的特殊集合,由我们的顶级用户在RapidMiner用户社区,而不是RapidMiner团队。每个进程都包含一个命名作者的头,简要解释其目的,并链接到其起源的线程。我们鼓励用户在使用每个流程之前阅读伴随它的在线对话,因为这个Repository中的流程不一定按发布的方式运行。

运营商

操作符:流程的元素,每个操作符接受输入并创建输出,具体取决于参数的选择。

又称:函数、公式、节点

要有效地使用RapidMiner Studio,您必须了解它运营商.RapidMiner Studio包含数百个操作符,因此任务的很大一部分是学习如何找到您需要的内容。搜索通常有两个主要策略:分层搜索而且关键字搜索.的RapidMiner社区也是支持的来源。

若要验证所找到的Operator是否具有所期望的功能,请阅读帮助

一旦你找到了你想要的Operator,至少有3种方法将它放入流程面板

  1. 拖放操作符

  2. 双击操作符

  3. 右键单击Operator并选择插入运算符从上下文菜单。

分层搜索

中的文件夹层次结构操作面板反映了典型的数据科学工作流程:乐鱼平台进入

  • 数据访问
  • 混合
  • 清洗
  • 建模
  • 得分
  • 验证
  • 实用程序
  • 扩展

通过打开这些文件夹及其子文件夹,您将对可用的内容有一些了解。

可以检查相同的层次结构文档的网站,其中包括帮助为每个操作符。

关键字搜索

另一种选择是关键字搜索。虽然操作符面板包含一个搜索字段,但推荐的过程是使用全球搜索,在用户界面右上角。全局搜索不仅可以找到操作符,还可以找到存储库中的数据和流程,以及扩展市场,甚至你可以从菜单中采取行动!

提示控件显示的操作符悬停时全球搜索,该操作符的“帮助”立即显示在帮助小组.如果你第一次最大化帮助面板,您可以快速扫描帮助页,以查找出现在搜索中的所有操作符。

社区搜索(群体智慧)

如果你已经开始建立一个过程,你正在寻找提示,“群体的智慧”可能会有帮助。“群体智慧”是一个可选择的推荐系统,基于其他RapidMiner用户的使用模式。它根据流程中已经包含的操作符预测您可能需要哪些操作符。要激活它,点击上面的按钮激活群体智慧.您可以在任何时候通过菜单项激活它或禁用它设置>首选项>推荐>使运营商的建议

如果你还是找不到你要找的东西RapidMiner社区可能会有帮助。RapidMiner的数据乐鱼平台进入科学团队积极贡献。

参数

参数:配置操作员行为的选项。

的内容参数面板是上下文相关的。选择任何操作符中显示的流程面板,参数面板显示配置该操作符的选项。因为RapidMiner Studio包含许多操作符,每个操作符都有自己独特的功能,所以参数的范围也相当多样化。默认情况下,RapidMiner Studio只会显示更常用的参数。若要查看所有可用参数,请单击展示先进的参数

要理解这些参数,您需要更多地了解Operator;阅读帮助这可能是一个很好的开始。一个lternatively, hover the information icon next to the parameter of interest, and a help text is displayed.

帮助

帮助:显示当前操作符的帮助文本。

的内容帮助小组也是上下文相关的。选择任何操作符中显示的流程面板,帮助面板显示该操作符的帮助文本。帮助面板提供了有用的背景信息,包括:

  • 操作符的概述、用途和功能
  • 运算符输入和输出的描述港口
  • 经营者的描述参数
  • 一个或多个例子,以教程的形式过程

在帮助面板中,单击一个示例立即在RapidMiner Studio中打开相关的教程过程,以便您可以检查相关的应用程序。

RapidMiner Studio中提供的所有操作符帮助文本也都可用在线

重新配置设计视图

若要将设计视图恢复到默认面板设置,请选择视图>还原默认视图

要优化屏幕空间,可以考虑重新组织面板。首先注意,你可以右键单击连接到任何面板的选项卡,并选择以下选项之一:

  • 分离-面板从RapidMiner Studio分离。
  • 最大化-面板占据了分配给面板的全部空间。
  • 关闭—从用户界面中移除面板。

例如,如果您需要更多的空间来读取帮助,您可以最大化帮助面板,然后再次单击面板选项卡以将用户界面恢复到其原始状态。如果你真的不需要一个面板,你可以关闭它。一个封闭的面板可以通过菜单项下恢复视图>显示面板

通过拖放可以获得其他配置:

  • 面板可以调整大小
  • 面板可以移动
  • 面板可以显示为选项卡。

下表总结了可用的面板,其中大多数没有显示,例如XML面板,它显示您的流程的XML表示。载于大胆的是默认面板。要从此列表中显示面板,请从下面的菜单中选择它视图>显示面板

面板 描述
应用程序对象 模拟一个RapidMiner AI Hub App环境
后台监控 管理后台进程和结果
上下文 高级流程设置和宏
数据编辑器 提供类似电子表格的数据操作
帮助 所选操作符的文档
日志 查看事件记录
已定义的实时概述
运营商 所有可添加到进程的操作符
概述 对大型流程的缩小概述
参数 在流程中配置Operator行为
问题 查看流程中的潜在问题
过程 在这里创建和设计您的流程
存储库 管理数据和流程
资源监控器 显示当前使用的RAM
结果历史 此会话的所有流程的历史记录
人工智能监控中心 运行在RapidMiner AI Hub上的进程
快照历史 显示了快照历史版本控制下的项目的状态
流程的树形表示
XML 流程的XML表示

若要将设计视图恢复到默认面板设置,请选择视图>还原默认视图