类别

版本

您正在查看9.2 -版本的RapidMiner Studio文档点击这里查看最新版本

设计视图

参见视频介绍到RapidMiner GUI。

RapidMiner Studio是一个用于预测分析的可视化工作流设计器,它将数据科学和机器学习带给分析团队的每个人。乐鱼平台进入

当你从事任何类型的新项目时,第一步通常是去白板,在那里你将计划工作流程并确定实现目标的关键步骤。如果你是一名数据科学家,工作流程通常包括以下一个或多个步骤:

  • 导入数据
  • 准备数据
  • 建立模型
  • 验证模型
  • 应用模型

RapidMiner Studio在软件中实现了您的白板工作流设计视图.设计视图包括许多面板

  • 数据、过程和结果存储在存储库
  • 调用每个工作流的基本元素运营商
  • 操作人员通过港口.第一个程序的输出作为输入传递给第二个程序。
  • 帮助您转换和分析数据的一组连接的操作符被称为A过程
  • 操作符的行为可以通过更改其参数
  • 操作符的行为可以通过阅读帮助

下面将更详细地讨论每一个术语。

默认视图

过程

流程:一组相互连接的操作符,帮助您转换和分析数据。

又称:流程、程序、管道、图

你的目标是创造一个成品过程即产生一个结果的一组连通的算子。例如,您的流程可能读取一个数据集并构建一个预测模型。当你连接了你所有的运营商并设置他们的参数,按下运行运行箭头按钮,结果将显示在结果视图

正如在运行进程,运行流程的方法不止一种。你可以运行它:

随着流程规模的增长,您将需要一些方法来管理其复杂性。

将流程保存到存储库中,选择文件>保存过程从主菜单中。

您可以通过首先将其导出到XML文件来轻松地共享进程:

  • 要导出流程,请选择文件>出口流程.导出对话框允许您将文件保存为.rmp. xml;实际上,这两种文件格式是相同的(XML)。
  • 要导入该流程,请选择文件>导入过程

港口

要构建流程,必须连接每个流程的输出操作符到下一个的输入,通过a港口.要连接两个端口,请单击它们。将端口悬停可看到带有附加信息的工具提示。在连接两个操作符时,需要确保第一个操作符的输出端口与第二个操作符的输入端口兼容,否则将得到错误消息。每个操作符的输入和输出端口在操作符中描述帮助中给出了完整的端口列表入门词汇

如果你想看到结果结果视图,必须将进程中的最后一个Operator连接到进程面板右侧的结果端口(“res”)。

提示:双击输出端口,它将连接到下一个可用的结果(“res”)端口。

下面的示例展示了一个简单的过程,其中Excel文件中的数据被(1)读取,(2)存储在存储库,(3)显示在结果视图中。

一个简单的过程

下面的截图显示了一个更复杂的过程,由汽车模型

一个更复杂的过程

存储库

存储库:存储数据、过程和结果的地方,可以是本地的也可以是远程的。

也称为:文件夹、工作区、项目

当使用RapidMiner Studio时,您需要一个地方来保存您的工作。的存储库可用于存储:

  • 数据
  • 流程
  • 结果

存储库可以是本地的或远程,以促进小组合作。它是存储进程的自然位置(文件>保存过程);是否将数据和结果保存在存储库中取决于您的用例。

首先,您的数据可能存在于文件或数据库中。RapidMiner Studio提供了许多运营商协助您导入资料,例如:读取Excel读数据库.要启动导入数据向导,请单击导入数据,或选择文件>导入数据从主菜单中。

给定数据和过程,您的结果总是可以重新生成,但可能有很好的理由将结果存储在Repository中:

  • 如果结果是一个基于大数据集的复杂模型,那么重新生成它将需要时间。
  • 如果您在RapidMiner服务器上运行进程,则需要存储结果(使用商店操作符),因为RapidMiner Server没有与结果视图在RapidMiner Studio。

绑定存储库

对于新用户和有经验的用户来说,与RapidMiner Studio捆绑的存储库都是非常宝贵的资源。它们提供了广泛的样本数据集和样本过程,以及解释性说明。

  • 培训资源乐鱼体育安装存储库是一个大的数据集和过程集,设计为在线培训课程和课程的伴侣RapidMiner学院.我们鼓励你利用这些免费课程来练习你的技能。
  • 样品存储库包含额外的数据集和过程,包括下面的时间序列示例样品>时间序列
  • 社区样本存储库是一个特殊的数据集和过程集合,由我们的顶级用户在RapidMiner用户社区,而不是RapidMiner团队。每个进程都包含一个命名作者的标题,简要说明其目的,并链接到它的起源线程。我们鼓励用户在使用每个进程之前阅读伴随它的在线对话,因为此存储库中的进程不一定以发布的方式运行。

运营商

操作符:流程的元素,每个操作符根据参数的选择接受输入并创建输出。

又称:函数、公式、节点

要有效地使用RapidMiner Studio,您必须了解它运营商.RapidMiner Studio包括数百个操作员,因此大部分任务是学习如何找到您需要的内容。与搜索一样,有两种主要策略:分层搜索关键字搜索.的RapidMiner社区也是一种支持。

要验证您找到的操作符是否具有您期望的功能,请阅读帮助

一旦你找到了你想要的操作符,至少有三种方法可以把它放进流程面板

  1. 拖放操作符

  2. 双击操作符

  3. 右键单击Operator,然后选择插入运算符从上下文菜单中。

分层搜索

文件夹的层次结构操作面板反映了典型的数据科学工作流程:乐鱼平台进入

  • 数据访问
  • 混合
  • 清洗
  • 建模
  • 得分
  • 验证
  • 实用程序
  • 扩展

通过打开这些文件夹及其子文件夹,您将对可用的内容有所了解。

可以对相同的层次结构进行检查文档的网站,其中包括帮助为每个操作符。

关键字搜索

另一种选择是关键字搜索。虽然操作符面板包含一个搜索字段,但推荐的过程是使用全球搜索,位于用户界面右上角。全局搜索不仅可以找到操作符,还可以从存储库中找到数据和过程,从市场,甚至可以从菜单中采取行动!

提示:将显示的操作符悬停时全球搜索时,该操作符的帮助将立即显示在帮助小组.如果你先最大化帮助面板,您可以快速扫描帮助页面中出现在搜索中的所有操作符。

社区搜索(群体智慧)

如果你已经开始建立一个流程,并且正在寻找提示,那么“群体智慧”可能会有所帮助。“人群智慧”是一个可选择的推荐系统,基于其他RapidMiner用户的使用模式。它根据流程中已经包含的操作符预测您可能需要哪些操作符。要激活它,请点击上面写着激活群体智慧.您可以随时通过菜单项激活或停用它设置>首选项>推荐>启用操作员建议

如果你仍然找不到你要找的东西,那RapidMiner社区也许能帮上忙。RapidMiner的数据乐鱼平台进入科学团队积极贡献。

参数

参数:用于配置操作员行为的选项。

的内容参数面板是上下文相关的。选择任何操作符显示在流程面板,参数面板显示配置该操作符的选项。由于RapidMiner Studio包含许多操作符,每个操作符都有自己独特的功能,因此参数范围也非常多样化。默认情况下,RapidMiner Studio将只显示更常用的参数。要查看所有可用的参数,请单击显示高级参数

为了理解这些参数,你需要对Operator有更多的了解;阅读帮助这个操作符可能是一个很好的起点。Alternatively, hover the information icon next to the parameter of interest, and a help text is displayed.

帮助

帮助:显示当前操作员的帮助文本。

的内容帮助小组也是依赖于上下文的。选择任何操作符显示在流程面板,帮助面板显示该操作符的帮助文本。帮助面板提供了有用的背景信息,包括:

  • 操作符的概述、目的和功能
  • 对运算符输入和输出的描述港口
  • 操作员的描述参数
  • 以教程的形式提供一个或多个示例过程

在帮助面板中,单击示例立即打开RapidMiner Studio中的相关教程过程,以便您可以检查相关应用程序。

RapidMiner Studio中提供的所有操作员帮助文本也可用在线

重新配置设计视图

为了优化屏幕空间,您可以考虑重新组织面板。首先请注意,您可以右键单击与任何面板连接的选项卡,并选择以下选项之一:

  • 分离-面板与RapidMiner Studio分离。
  • 最大化—面板填充分配给面板的整个空间。
  • 关闭—用户界面面板被拔出。

例如,如果您需要更多的空间来读取帮助,您可以最大化帮助面板,然后再次单击面板选项卡以将用户界面恢复到原始状态。如果你真的不需要面板,你可以关闭它。关闭的面板可以通过下面的菜单项恢复视图>显示面板

其他配置可通过拖放:

  • 面板可以调整大小
  • 面板可以移动
  • 面板可以显示为选项卡。

下表总结了可用的面板,其中大多数没有显示,例如XML面板,它显示流程的XML表示形式。中显示的面板大胆的是默认面板。要显示此列表中的面板,请从下面的菜单中选择它视图>显示面板

面板 描述
应用程序对象 模拟一个RapidMiner服务器应用程序环境
后台监控 管理后台进程和结果
云监控 管理云流程和结果
上下文 高级进程设置和宏
数据编辑器 提供类似电子表格的数据操作
帮助 所选操作符的文档
历史 RapidMiner服务器上进程的版本控制
日志 查看已记录事件
已定义的实时概述
运营商 所有操作者可添加到您的过程中
概述 大型进程的缩小概览
参数 在您的流程中配置操作员行为
问题 查看流程中的潜在问题
过程 在这里创建和设计您的流程
存储库 管理您的数据和流程
资源监控器 显示当前使用的RAM
结果历史 此会话产生的所有进程的历史记录
服务器监控 RapidMiner服务器上运行的进程
XML 流程的XML表示形式

要将Design View恢复为默认面板设置,请选择视图>恢复默认视图