您正在查看9.2 -版本的RapidMiner Studio文档点击这里查看最新版本
使用Amazon S3连接器
Amazon S3连接器允许您直接从RapidMiner Studio访问Amazon S3存储。这两个读和写支持操作。本文档将指导您如何:
连接到您的Amazon S3帐户
在使用Amazon S3连接器之前,必须配置一个新的Amazon S3连接。为此,您将需要帐户的连接详细信息(至少是访问密钥和密钥)。
打开管理连接对话框通过转到工具>管理连接.
点击添加连接在左下方:
输入新连接的名称并选择Amazon S3连接随着连接类型:
填写您的Amazon S3账户的连接详情:
请注意,Amazon S3支持任意文件夹“分隔符”(分隔嵌套文件夹的符号),例如,用于url的“/”或Microsoft Windows使用的“\”。如果配置指定了错误的分隔符,则文件夹结构可能无法在RapidMiner Studio中正确显示。不过不要担心,稍后您总是可以在连接配置中更改分隔符。
虽然不是必需的,但我们建议通过单击测试按钮。
点击保存所有更改保存连接并关闭管理连接窗口。现在可以开始使用Amazon S3操作符了!
阅读Amazon S3
的阅读Amazon S3操作符从您的Amazon S3帐户读取数据。操作符可用于加载任意文件格式,因为它只下载而不处理文件。要处理这些文件,您需要使用额外的操作符,例如创建文档,读取Excel,或读取XML.
让我们从从Amazon S3读取一个简单的日志文件开始。
打开一个新进程在RapidMiner Studio中,拖动阅读Amazon S3操作员进入过程查看,并将其输出端口连接到进程的结果端口:
中选择您的Amazon S3连接连接的下拉菜单参数视图。
点击文件选择器按钮查看您的Amazon S3帐户中的文件。选择要加载的文件并单击开放.
如上所述,阅读Amazon S3操作符不处理指定文件的内容。在我们的示例中,我们选择了一个日志文件(纯文本文件)。此文件类型可以通过阅读文档操作符。
添加一个阅读文档之间的算子阅读Amazon S3操作符和结果端口:
运行这个过程!在结果透视图中,您应该看到包含日志文件内容的单个文档。
您现在可以使用进一步的文本处理操作符来处理此文档,例如,确定某些事件的共性。要将结果写回Amazon S3,可以使用写Amazon S3操作符。的连接类型阅读Amazon S3操作符和具有类似的界面。