类别

版本

使用Azure Blob存储连接器

Azure Blob存储连接器允许您直接从RapidMiner Studio访问Azure Blob存储。这两个而且支持操作。本文档将指导你如何:

连接到Azure Blob存储帐户

要配置新的Azure Blob存储连接,您需要Azure Blob存储帐户的连接详细信息(至少是访问密钥和秘密密钥)。

  1. 在RapidMiner Studio中,右键单击要存储Azure Blob存储连接的存储库并选择新建连接图标创建连接

    你也可以点击连接>创建连接新建连接图标并选择存储库在下面的对话框中。

  2. 为新连接指定一个名称,并设置连接类型Azure Blob存储图标Azure Blob存储

  3. 点击创建图标创建然后切换到设置页中的编辑连接对话框。

  4. 填写Azure Blob存储帐户的连接详细信息:

    虽然不是必需的,但我们建议通过单击连接测试图标测试连接按钮。如果测试失败,请检查详细信息是否正确。

  5. 点击Save图标保存保存连接并关闭编辑连接对话框。现在可以开始使用Azure Blob存储操作符了!

从Azure Blob存储读取

阅读Azure Blob存储操作员从Azure Blob存储帐户读取数据。该操作符可用于加载任意格式的文件,因为它只下载而不处理文件。要处理这些文件,您需要使用额外的操作符,例如阅读文档读取Excel,或读取XML

让我们从Azure Blob Storage读取一个简单的日志文件开始。

  1. 拖一个阅读Azure Blob存储运算符流程面板.选项的Azure Blob存储连接连接条目参数从存储库的Connections文件夹中删除存储库选择器图标旁边的按钮:

    或者,您可以将Azure Blob存储连接从存储库拖到流程面板并将生成的运算符与阅读Azure Blob存储操作符。

  2. 点击文件选择器按钮文件选择器图标以查看Azure Blob Storage帐户中的文件。选择需要加载的文件,单击文件选择器图标开放

    如上所述,阅读Azure Blob存储操作符不处理指定文件的内容。在我们的示例中,我们选择了一个日志文件(纯文本文件)。方法处理此文件类型阅读文档运算符的一部分文本处理扩展为RapidMiner工作室。

  3. 如果您还没有安装文本处理RapidMiner Studio的扩展,请现在就去市场做。然后添加阅读文档之间的运算符阅读Azure Blob存储操作符和结果端口:

  4. 运行运行过程这个过程!在结果透视图中,您应该看到包含日志文件内容的单个文档。

现在可以使用进一步的文本处理操作符来处理该文档,例如,确定某些事件的共性。要将结果写回Azure Blob存储,可以使用编写Azure Blob存储操作符。的连接类型使用相同的连接类型阅读Azure Blob存储操作符,并具有类似的接口。你也可以从一组文件中读取在Azure Blob存储目录中,使用循环Azure Blob存储操作符。为此,您需要指定连接条目文件夹以及带有嵌套操作符的处理循环的步骤。如需更多详情,请参阅循环Azure Blob存储操作符。