只从文本中搜索特定的关键字

tahsintahsin 成员职位:20.因素二世
你好,

我想从一个文本搜索一个特定的关键字,并分配他们的类型。我用的是生成属性操作符和编写一个函数来搜索关键字。我有个问题,我的单词列表里有“骗子”,“谎言”,“撒谎”。我使用的函数表达式选取了像“family”这样的词谎言”、“全家骗子“也一样。我只想要有“谎言”,“骗子”的词,而不是“家人”或“熟悉”的词。

这就是我的方法;

如果匹配(指出,“。*谎言。*”),“谎言”,
如果匹配(指出,“。*骗子。*”),“谎言”,
如果匹配(笔记,”。*撒谎。*”),“谎言”,
如果匹配(笔记,”。*撒谎。*”),“撒谎”,“没有一个”))))

任何帮助都是感激的。谢谢

最佳答案

  • MarcoBarradasMarcoBarradas 管理员,员工,RapidMiner认证分析师,会员职位:246独角兽
    解决方案接受
    你好@tahsin

    您可以使用配置了regex的MAP操作符来替换文本属性上的所有其他文本。您可能需要先创建它的副本。
    我在粘贴一个可以帮助你实现目标的过程。
    既然你正在做一些文本处理,我建议你去读一下学院的文本和网络挖掘教程

    https://academy.www.turtlecreekpls.com/learn/course/text-and-web-mining-with-rapidminer/text-and-web-mining/lets-get-started

    <?xml version="1.0" encoding="UTF-8"?><进程版本="9.9.002">      <参数key="logverbosity" value="init"/> <参数key="random_seed" value="-1"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="" 30"/> <参数key="encoding" value="SYSTEM"/> <进程expanded="true">                       <                            
    MartinLiebig

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3286年RM数据科学家
    你不想使用contains函数吗?

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • tahsintahsin 成员职位:20.因素二世
    嗨,Martin,我先用了contains函数,但它做的事情是一样的。捡起一切。

    这就是我在python里的做法,
    df('类型']= np.where (df.Notes.str.contains (r ' \ b(谎言| " |撒谎)\ b”),“谎言”,
    np.where (df.Notes.str.contains (r \ b(躺)\ b),“撒谎”,“没有一个”))

    不知道在这里该怎么做。
  • tahsintahsin 成员职位:20.因素二世
登录注册置评。