使用RapidMiner Studio内置示例
完成本教程后,您可以使用RapidMiner Studio内置的示例存储库(带有解释性帮助文本)进行更多练习。示例数据和流程位于存储库面板:
- 的数据文件夹包含十几个不同的数据集,这些数据集将用于示例练习。它们包含各种不同的数据类型。
- 的流程文件夹包含130多个示例进程,按功能组织,演示了预处理、可视化、集群和许多其他主题。
要使用示例,请展开流程文件夹中。
使用这些过程有两种机制:
双击查看其他详细信息
通过双击示例进程,您可以了解很多内容。
选择一个进程。这个例子使用01 _decisiontree。
双击进程名。RapidMiner打开进程并将其显示在画布上:
要查看为操作符设置的参数,请单击该操作符。例如,如果您单击检索操作符,参数面板报告使用的数据集(“高尔夫”):
点击运行进程。
拖放以提高效率
如果将流程从存储库拖到画布上,则情况将与上面的情况有所不同。RapidMiner自动创建一个执行操作符,当运行时,执行您拖入的流程。
同样,这个例子使用01 _decisiontree。
拖01 _decisiontree在画布上。
注意你看到的是执行操作符。你看不到组成这个过程的操作者。中双击该流程存储库面板。
连接的结果(res)端口执行操作符转到流程的结果端口,并单击运行运行进程。
当您获得经验并开始设计包含大量操作符的复杂流程时,您将希望构建某种结构。通过保存多操作程序,您可以根据需要重用它们。例如,如果您做了大量的分析,您可以创建一个用于更新数据的过程,一个用于数据预处理的过程,一个用于模型创建的过程,一个用于模型性能检查的过程,等等。将每个流程保存到存储库中,并根据需要将它们拖到画布中。然后,你的主要进程将包含刚刚相互连接执行操作符。整洁。