打开文件操作符

JugiJugi RapidMiner认证分析师,会员职位:12因素二世
编辑2018年12月 产品反馈-解决

如果有一个操作符可以从HDFS读取文件,而不需要在hive中定义模式,那就太棒了。

然后,它应该像Open file操作符对本地文件、URL和Repository Blob条目所做的那样提供文件。

在这个新的操作符中应该使用user和kerberos等HDFS安全特性。

其中一个应用程序是处理来自集群的XML或JSON文件。

这对于进程下推很有用,因为可以在集群中处理各种文件类型。

土地 JEdward 阿曼 yyhuang 狮子 winkmar SGolbert daniel_moser matt_yauch
9
9票

拒绝·最后一次更新

来自PM: Radoop基本上依赖于Hive表来处理exampleset,或者更确切地说,类似于exampleset的、基于行的数据单元。换句话说,数据单元是“表行”,而不是文件,数据单元是数据的分割和并行处理的基础。更改代码,使其能够在文件级别上工作,这将是一个相当昂贵的努力,但我们正在为下一次迭代的Radoop奠定概念,我们将以支持基于文件的操作的方式构建它。刺激- 761

评论

  • JEdwardJEdward RapidMiner认证分析师,RapidMiner认证专家,会员职位:578独角兽

    不仅仅是简单的JSON或XML,图像文件也是如此。

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,会员职位:2531年独角兽

    你好,

    我同意,这将使RM更加有用,成为体系结构中真正的核心。当然,还应该添加一个写文件(HDFS)操作符:)

    问候,

    塞巴斯蒂安。

  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,会员,大学教授,PM版主职位:2959年社区经理
登录注册置评。