设计视图
看到也视频介绍到RapidMiner GUI。
RapidMiner Studio是预测性分析的可视化工作流设计器,为分析团队的每个人带来数据科学和机器学习。乐鱼平台进入
当你从事任何类型的新项目时,第一步通常是在白板上,在那里你将计划工作流程并确定实现目标的关键步骤。如果你是一名数据科学家,工作流程通常包括以下一个或多个步骤:
- 导入数据
- 准备数据
- 建立一个模型
- 验证模型
- 应用模型
RapidMiner Studio在软件中实现了您的白板工作流设计视图.设计视图包括许多面板.
- 数据、过程和结果存储在存储库.
- 每个工作流的基本元素都被调用运营商.
- 操作员通过港口.第一个的输出作为输入传递给第二个。
- 帮助您转换和分析数据的一组连接的操作符称为过程.
- 操作符的行为可以通过更改参数.
- 操作符的行为可以通过阅读帮助.
下面将更详细地讨论这些术语。
默认视图
过程
流程:一组连接的操作符,帮助您转换和分析数据。
又称:流程、程序、管道、图表
你的目标是创建一个完成的过程,产生结果的一组连接的操作符。例如,您的流程可能读取一个数据集并构建一个预测模型。当你把你所有的运营商并设置自己的参数,按下运行按钮,结果将显示在结果视图.
讨论了在运行一个进程,有不止一种方式来运行您的进程。你可以运行它:
- 在本地
- 在后台
- 在RapidMiner AI Hub
- 在RapidMiner AI Hub上,作为计划过程
随着流程规模的增长,您将需要一些方法来管理它们的复杂性。
- 你可以隐藏的复杂性,通过将运算符组移动为单个运算符
子流程
操作符。 - 你可以从另一个进程中运行一个进程通过
执行过程
操作符。
将您的过程保存到存储库中,选择文件
>保存过程
从主菜单。
你可以通过先将进程导出到一个XML文件来轻松地共享它:
- 要导出流程,请选择
文件
>出口流程
.导出对话框允许您将文件保存为.rmp
或. xml
;实际上,这两种文件格式是相同的(XML)。 - 要导入流程,请选择
文件
>导入过程
.
港口
要构建流程,必须连接每个流程的输出操作符到下一个的输入通过a港口.要连接两个端口,请单击它们。悬停一个端口可以看到带有附加信息的工具提示。在连接两个操作符时,需要确保第一个操作符的输出端口与第二个操作符的输入端口兼容,否则将收到错误消息。每个Operator的输入和输出端口在Operator中进行了描述帮助,而完整的端口列表载于开始词汇表.
如果你想看结果结果视图,您必须将进程中的最后一个Operator连接到进程面板右侧的结果端口(“res”)。
提示:双击输出端口,它将连接到下一个可用的结果(“res”)端口。
下面的例子展示了一个简单的过程,其中(1)读取Excel文件中的数据,(2)存储在存储库,(3)显示在结果视图中。
一个简单的过程
下面的截图显示了一个更复杂的过程,由汽车模型.
更复杂的过程
存储库
存储库:您的中心数据存储实体。它在本地或远程保存连接、数据、过程和结果。
也称为:文件夹、工作区、项目
当使用RapidMiner Studio工作时,您需要一个地方来保存您的工作。的存储库可用于存储:
- 连接
- 数据
- 流程
- 结果
- 任意文件(从RapidMiner Studio 9.7开始)
注意,在RapidMiner 9.7中,的概念存储库有几种不同的类型:
遗产库 | 对于RapidMiner Studio 9.6和更早的版本,这是标准的存储库,没有版本控制和有限的文件类型集。您不能创建遗留存储库,但您仍然可以使用以前创建的任何遗留存储库,或者迁移他们到一个新的存储库。 一个远程存储库on RapidMiner AI Hub是仍然这种类型的。 |
远程存储库 | RapidMiner AI Hub的每个实例都有和仍有一个独特的中央存储库,与RapidMiner Studio的遗留库具有相同的特征:没有版本控制和有限的文件类型集。 |
存储库(本地) | 从RapidMiner Studio 9.7开始,本地存储库支持任意文件类型,但不支持版本控制。这种类型的存储库在RapidMiner AI Hub上没有对应的存储库。 当您在存储库中双击一个非rapidminer文件时,它将在该文件类型的标准应用程序中打开。当您将一个非rapidminer文件拖到流程面板时,一个打开的文件操作符创建。扩展,例如Python脚本扩展,可以提供额外的功能,因此将Python脚本拖到Process Panel中会创建一个执行Python操作符。 |
项目 | 在RapidMiner Studio 9.7中,a项目支持版本控制和任意文件类型。它的行为方式与Repository相同,但增加了版本控制。 如项目文档中所述RapidMiner工作室而且RapidMiner AI中心,一个项目总是同时具有本地组件和服务器组件,这两个组件是定期同步. |
存储库是存储您的连接和过程(文件
>保存过程
);是否将数据、结果或其他文件保存在Repository中取决于您的用例。
首先,您的数据可能存在于文件或数据库中。RapidMiner Studio提供了许多运营商帮助您导入数据,例如,读取Excel
或读数据库
.要启动Import Data向导,请单击导入数据
,或选择文件
>导入数据
从主菜单。
给定数据和过程,您的结果总是可以重新生成的,但可能有很好的理由将结果存储在一个Repository中:
- 如果结果是一个基于大型数据集的复杂模型,重新生成它将需要时间。
- 如果你在RapidMiner AI Hub上运行一个进程,你将需要将结果存储(使用
商店
操作员),因为RapidMiner AI Hub没有等价的结果视图在RapidMiner工作室。
绑定存储库
对于新用户和有经验的用户来说,与RapidMiner Studio捆绑的知识库都是非常宝贵的资源。它们提供了大量的样本数据集和样本流程,以及解释性说明。
- 的
培训资源乐鱼体育安装
知识库是一组大型数据集和流程,是作为在线培训课程和课程的配套而设计的RapidMiner学院.我们鼓励您利用这些免费课程来练习您的技能。 - 的
样品
存储库包含额外的数据集和过程,包括下面的时间序列示例样品
>时间序列
. - 的
社区样本
存储库是数据集和过程的特殊集合,由我们的顶级用户在RapidMiner用户社区,而不是RapidMiner团队。每个进程都包含一个命名作者的头,简要解释其目的,并链接到其起源的线程。我们鼓励用户在使用每个流程之前阅读伴随它的在线对话,因为这个Repository中的流程不一定按发布的方式运行。
运营商
操作符:流程的元素,每个操作符接受输入并创建输出,具体取决于参数的选择。
又称:函数、公式、节点
要有效地使用RapidMiner Studio,您必须了解它运营商.RapidMiner Studio包含数百个操作符,因此任务的很大一部分是学习如何找到您需要的内容。搜索通常有两个主要策略:分层搜索而且关键字搜索.的RapidMiner社区也是支持的来源。
若要验证所找到的Operator是否具有所期望的功能,请阅读帮助.
一旦你找到了你想要的Operator,至少有3种方法将它放入流程面板.
拖放操作符
双击操作符
右键单击Operator并选择
插入运算符
从上下文菜单。
分层搜索
中的文件夹层次结构操作面板反映了典型的数据科学工作流程:乐鱼平台进入
- 数据访问
- 混合
- 清洗
- 建模
- 得分
- 验证
- 实用程序
- 扩展
通过打开这些文件夹及其子文件夹,您将对可用的内容有一些了解。
可以检查相同的层次结构文档的网站,其中包括帮助为每个操作符。
关键字搜索
另一种选择是关键字搜索。虽然操作符面板包含一个搜索字段,但推荐的过程是使用全球搜索,在用户界面右上角。全局搜索不仅可以找到操作符,还可以找到存储库中的数据和流程,以及扩展市场,甚至你可以从菜单中采取行动!
社区搜索(群体智慧)
如果你已经开始建立一个过程,你正在寻找提示,“群体的智慧”可能会有帮助。“群体智慧”是一个可选择的推荐系统,基于其他RapidMiner用户的使用模式。它根据流程中已经包含的操作符预测您可能需要哪些操作符。要激活它,点击上面的按钮激活群体智慧
.您可以在任何时候通过菜单项激活它或禁用它设置
>首选项
>推荐
>使运营商的建议
.
如果你还是找不到你要找的东西RapidMiner社区可能会有帮助。RapidMiner的数据乐鱼平台进入科学团队积极贡献。
参数
参数:配置操作员行为的选项。
的内容参数面板是上下文相关的。选择任何操作符中显示的流程面板,参数面板显示配置该操作符的选项。因为RapidMiner Studio包含许多操作符,每个操作符都有自己独特的功能,所以参数的范围也相当多样化。默认情况下,RapidMiner Studio只会显示更常用的参数。若要查看所有可用参数,请单击展示先进的参数
.
要理解这些参数,您需要更多地了解Operator;阅读帮助这可能是一个很好的开始。一个lternatively, hover the information icon next to the parameter of interest, and a help text is displayed.
帮助
帮助:显示当前操作符的帮助文本。
的内容帮助小组也是上下文相关的。选择任何操作符中显示的流程面板,帮助面板显示该操作符的帮助文本。帮助面板提供了有用的背景信息,包括:
在帮助面板中,单击一个示例立即在RapidMiner Studio中打开相关的教程过程,以便您可以检查相关的应用程序。
RapidMiner Studio中提供的所有操作符帮助文本也都可用在线.
重新配置设计视图
若要将设计视图恢复到默认面板设置,请选择视图
>还原默认视图
.
要优化屏幕空间,可以考虑重新组织面板。首先注意,你可以右键单击连接到任何面板的选项卡,并选择以下选项之一:
分离
-面板从RapidMiner Studio分离。最大化
-面板占据了分配给面板的全部空间。关闭
—从用户界面中移除面板。
例如,如果您需要更多的空间来读取帮助,您可以最大化帮助面板,然后再次单击面板选项卡以将用户界面恢复到其原始状态。如果你真的不需要一个面板,你可以关闭它。一个封闭的面板可以通过菜单项下恢复视图
>显示面板
.
通过拖放可以获得其他配置:
- 面板可以调整大小
- 面板可以移动
- 面板可以显示为选项卡。
下表总结了可用的面板,其中大多数没有显示,例如XML面板,它显示您的流程的XML表示。载于大胆的是默认面板。要从此列表中显示面板,请从下面的菜单中选择它视图
>显示面板
.
面板 | 描述 |
---|---|
应用程序对象 | 模拟一个RapidMiner AI Hub App环境 |
后台监控 | 管理后台进程和结果 |
上下文 | 高级流程设置和宏 |
数据编辑器 | 提供类似电子表格的数据操作 |
帮助 | 所选操作符的文档 |
日志 | 查看事件记录 |
宏 | 已定义的实时概述宏 |
运营商 | 所有可添加到进程的操作符 |
概述 | 对大型流程的缩小概述 |
参数 | 在流程中配置Operator行为 |
问题 | 查看流程中的潜在问题 |
过程 | 在这里创建和设计您的流程 |
存储库 | 管理数据和流程 |
资源监控器 | 显示当前使用的RAM |
结果历史 | 此会话的所有流程的历史记录 |
人工智能监控中心 | 运行在RapidMiner AI Hub上的进程 |
快照历史 | 显示了快照历史版本控制下的项目的状态 |
树 | 流程的树形表示 |
XML | 流程的XML表示 |
若要将设计视图恢复到默认面板设置,请选择视图
>还原默认视图
.