类别

版本

使用RapidMiner Studio内置示例

完成本教程后,您可以使用RapidMiner Studio内置的示例存储库(带有解释性帮助文本)进行更多练习。示例数据和流程位于存储库面板:

  • 数据文件夹包含十几个不同的数据集,这些数据集将用于示例练习。它们包含各种不同的数据类型。
  • 流程文件夹包含130多个示例进程,按功能组织,演示了预处理、可视化、集群和许多其他主题。

要使用示例,请展开流程文件夹中。

使用这些过程有两种机制:

  • 双击显示带有帮助文本的单个操作符。这种方法最适合学习。
  • 拖放使进程立即可以运行。

双击查看其他详细信息

通过双击示例进程,您可以了解很多内容。

  1. 选择一个进程。这个例子使用01 _decisiontree

  2. 双击进程名。RapidMiner打开进程并将其显示在画布上:

  3. 要查看为操作符设置的参数,请单击该操作符。例如,如果您单击检索操作符,参数面板报告使用的数据集(“高尔夫”):

  4. 点击运行箭头运行进程。

拖放以提高效率

如果将流程从存储库拖到画布上,则情况将与上面的情况有所不同。RapidMiner自动创建一个执行操作符,当运行时运行箭头,执行您拖入的流程。

同样,这个例子使用01 _decisiontree

  1. 01 _decisiontree在画布上。

  2. 注意你看到的是执行操作符。你看不到组成这个过程的操作者。中双击该流程存储库面板。

  3. 连接的结果(res)端口执行操作符转到流程的结果端口,并单击运行运行箭头运行进程。

当您获得经验并开始设计包含大量操作符的复杂流程时,您将希望构建某种结构。通过保存多操作程序,您可以根据需要重用它们。例如,如果您做了大量的分析,您可以创建一个用于更新数据的过程,一个用于数据预处理的过程,一个用于模型创建的过程,一个用于模型性能检查的过程,等等。将每个流程保存到存储库中,并根据需要将它们拖到画布中。然后,你的主要进程将包含刚刚相互连接执行操作符。整洁。