Regex从帖子中提取Twitter句柄

esboylesesboyles 成员职位:2贡献我
2018年12月编辑 帮助

上下搜索要与生成属性操作符一起使用的正则表达式@handle来自twitter帖子。

谁有高效准确的表达方式?

注意,可能有多个@handles所以我都想要。

多谢。

答案

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽

    作为标记化的一部分,我在Text Processing中完成了所有这些工作,但是如果您想在tweet级别上提取它,我将使用带有捕获组的Replace类型操作符之一。

    sgenzer
  • esboylesesboyles 成员职位:2贡献我

    搜索仍在继续……在生成属性操作符中尝试此操作。(?:\s|\A)[##]+([A- za -z0-9-_]+)认为我应该从生成标签到存储以供以后分析开始。

    这是在http://www.regexplanet.com/但是当作为表达式实现时,RM声明令牌识别错误在?

    有什么建议可以让这个看似简单的方法奏效吗?RM是否实现了Java Regex规范或其他什么?

    谢谢

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    @esboyles-所以快速搜索这里的社区“regex不工作”揭示了Ingo的一个很好的帖子,他谈到了javascript regex解析器与java regex解析器之间的差异:http://community.www.turtlecreekpls.com/t5/RapidMiner-Studio-Forum/regex-not-working/m-p/35676

    斯科特

登录注册置评。