重命名替换- REGEX

迈克迈克 成员职位:21因素二世
嗨,大家-努力利用正则表达式重命名列后旋转。理想情况下,尝试删除“count(IDT)_”,并将年份保留在头部。任何帮助都将不胜感激。附带XML和样例数据。

<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.0.002”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<列出关键= "注释" / >
/> .
<列出关键= " data_set_meta_data_information " >
/> .
< / >列表
UIO
< /操作符>
<列出关键= " filters_list " >
.
< / >列表
< /操作符>
< /操作符>
<列出关键= " aggregation_attributes " >
< / >列表
.
< /操作符>
.
< /操作符>
<列出关键= " key_attributes " >
< / >列表
< /操作符>
< /操作符>
/> .
/> .
.
.
> < /过程
< /操作符>
> < /过程

标记:

最佳答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:824独角兽
    解决方案接受
    这就跟你问声好!

    在本例中,您需要在两个地方使用regexp。
    属性过滤器类型:regular_expression
    正则表达式:count\(IDT\)_。+(.+是必须的,因为在这种情况下,RapidMiner想要匹配整个字符串)
    replace what: count\(IDT\)_(这里没有。+也可以,因为我们只是匹配字符串的这一部分)

    问候,
    Balazs
    迈克

答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:824独角兽
    这就跟你问声好!

    的括号数(IDT) _在正则表达式中有特殊的含义。下面是正确的答案:数\ (IDT \) _

    问候,
    Balazs
  • 迈克迈克 成员职位:21因素二世
    @BalazsBarany谢谢你!我理解转义字符识别括号,但仍有2个问题
    1 -不识别属性
    2 - regex仍然不识别count\(IDT\)_模式替换为什么。
    任何其他的想法都会有帮助
  • 迈克迈克 成员职位:21因素二世
    @BalazsBarany-太棒了,谢谢!这工作。在这种情况下,加号的处理方式是否与属性名中的“year”处理方式相同?谢谢你的帮助!
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:824独角兽
    这就跟你问声好!

    是的,RapidMiner需要匹配属性选择的完整字符串,而不仅仅是字符串的一部分。的+。after count\(IDT\)_匹配变量部分,在您的情况下是年份。

    问候,
    Balazs
登录注册置评。