数据清理提示:如何将属性重命名为小写

MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
2018年11月编辑 知识库
320年px-cyrillic_letter_a_ -_uppercase_and_lowercase.svg.png

如果您想重命名属性,重命名和通过替换操作符重命名是功能强大的工具。然而,在某种程度上,这些工具还不够。举个例子将所有属性转换为小写字符.对于某些数据库或hdfs,您需要这个。这个问题的解决方案是一个非常短的groovy脚本,它循环遍历所有属性并用小写版本替换它们。

exampleeset inputData = input[0];
for(属性a: inputData.getAttributes()){
.toLowerCase a.setName (a.getName () ())



返回inputData;

如果你在hdfs上工作,你可能还想用under scores替换空白。这可以通过在脚本中添加一个小的.replace来实现。

exampleeset inputData = input[0];
for(属性a: inputData.getAttributes()){
.toLowerCase a.setName (a.getName()()。取代 (" ","_"))



返回inputData;

附上的是在泰坦尼克号数据集上演示这一点的过程。

- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德
罗宾

评论

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽

    @mschmitz谢谢你的聪明的解决方法!但似乎这将是一些不错的内置功能添加到RapidMiner。对于像这样的简单数据ETL任务,不得不使用groovy脚本总是令人遗憾的。也许是将来的功能请求?听起来像是“转换案例”和“重命名”操作符之间的混搭:

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家

    @Telcontar120

    真正的功能很可能是一个类似于“生成属性”的表达式编辑器,但针对的是属性名。这不是像这个脚本那样简单的操作符。

    @sgenzer、思想?

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    我同意@Telcontar120-对我来说像是一个操作工具箱:)


    斯科特

  • JEdwardJEdward RapidMiner认证分析师,RapidMiner认证专家,成员职位:578独角兽

    我同意,但不只是一个工具箱操作员。我希望能够用RegEx做到这一点。

    https://www.regular-expressions.info/replacecase.html

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.6.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    < /操作符>



    替换为大写
    < /操作符>





    如果能做到这一点就太好了!<https://www.regular-expressions.info/replacecase.html < / description>
    > < /过程
    < /操作符>
    > < /过程
登录注册置评。