如何从标签和@中清理推文

baranbaran 成员职位:5因素二世
2018年11月编辑 帮助
大家好
我花了3天时间清理推特上的标签和@,但我做不到,有人需要帮助吗
标记:

答案

  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人

    你好,

    你是说去掉这些符号吗?”@,或者你还想删除后面的内容,例如:@ingomierswa”“#datascience”应该被完全删除吗?

    使用“Replace”操作符和一个简单的正则表达式可以很容易地实现这两者。下面是一个小示例流程,向您展示了如何完成此操作。

    希望这能帮到你,

    Ingo

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.3.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >

    <列出关键= " attribute_value " >
    @ingomierswa关于#datascience - end of twitter ."" / >
    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>


    @ | # " /祝辞;
    < /操作符>

    @ [a-zA-Z] * | # a-zA-Z *”/祝辞;
    < /操作符>









    > < /过程
    < /操作符>
    > < /过程
  • baranbaran 成员职位:5因素二世
    是的,谢谢你,我明天会尝试一下,然后编辑这篇文章。
  • HyramHyram 成员职位:39因素二世
    @IngoRM.这招管用,谢谢,但我只剩下字母了。这样可以清除#后面的字母,但不会清除其他字符。例如,我有@g_smug它只移除@g停在下划线处。有什么建议吗?

    谢谢
  • kaymankayman 成员职位:662独角兽

    像这样扩展你的正则表达式:

    \ b (@ | #) [^ \.\ s] +

    它看起来有点丑,但基本上意味着找到任何以@或#开头的“单词”,然后选择下一个空格、点或逗号之前的所有单词。你把它换成什么都没有,它就消失了。

登录注册置评。