数据清理提示:如何将属性重命名为小写
MartinLiebig
管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
如果您想重命名属性,重命名和通过替换操作符重命名是功能强大的工具。然而,在某种程度上,这些工具还不够。举个例子将所有属性转换为小写字符.对于某些数据库或hdfs,您需要这个。这个问题的解决方案是一个非常短的groovy脚本,它循环遍历所有属性并用小写版本替换它们。
exampleeset inputData = input[0];
for(属性a: inputData.getAttributes()){
.toLowerCase a.setName (a.getName () ())
}
返回inputData;
如果你在hdfs上工作,你可能还想用under scores替换空白。这可以通过在脚本中添加一个小的.replace来实现。
exampleeset inputData = input[0];
for(属性a: inputData.getAttributes()){
.toLowerCase a.setName (a.getName()()。取代 (" ","_"))
}
返回inputData;
附上的是在泰坦尼克号数据集上演示这一点的过程。
- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德
德国多特蒙德
1
评论
@mschmitz谢谢你的聪明的解决方法!但似乎这将是一些不错的内置功能添加到RapidMiner。对于像这样的简单数据ETL任务,不得不使用groovy脚本总是令人遗憾的。也许是将来的功能请求?听起来像是“转换案例”和“重命名”操作符之间的混搭:
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
嗨@Telcontar120,
真正的功能很可能是一个类似于“生成属性”的表达式编辑器,但针对的是属性名。这不是像这个脚本那样简单的操作符。
@sgenzer、思想?
德国多特蒙德
我同意@Telcontar120-对我来说像是一个操作工具箱
斯科特
我同意,但不只是一个工具箱操作员。我希望能够用RegEx做到这一点。
https://www.regular-expressions.info/replacecase.html