只从文本中搜索特定的关键字
你好,
我想从一个文本搜索一个特定的关键字,并分配他们的类型。我用的是生成属性操作符和编写一个函数来搜索关键字。我有个问题,我的单词列表里有“骗子”,“谎言”,“撒谎”。我使用的函数表达式选取了像“family”这样的词谎言”、“全家骗子“也一样。我只想要有“谎言”,“骗子”的词,而不是“家人”或“熟悉”的词。
这就是我的方法;
我想从一个文本搜索一个特定的关键字,并分配他们的类型。我用的是生成属性操作符和编写一个函数来搜索关键字。我有个问题,我的单词列表里有“骗子”,“谎言”,“撒谎”。我使用的函数表达式选取了像“family”这样的词谎言”、“全家骗子“也一样。我只想要有“谎言”,“骗子”的词,而不是“家人”或“熟悉”的词。
这就是我的方法;
如果匹配(指出,“。*谎言。*”),“谎言”,
如果匹配(指出,“。*骗子。*”),“谎言”,
如果匹配(笔记,”。*撒谎。*”),“谎言”,
如果匹配(笔记,”。*撒谎。*”),“撒谎”,“没有一个”))))
任何帮助都是感激的。谢谢
任何帮助都是感激的。谢谢
0
最佳答案
-
MarcoBarradas 管理员,员工,RapidMiner认证分析师,会员职位:246独角兽你好@tahsin
您可以使用配置了regex的MAP操作符来替换文本属性上的所有其他文本。您可能需要先创建它的副本。
我在粘贴一个可以帮助你实现目标的过程。
既然你正在做一些文本处理,我建议你去读一下学院的文本和网络挖掘教程
https://academy.www.turtlecreekpls.com/learn/course/text-and-web-mining-with-rapidminer/text-and-web-mining/lets-get-started
<?xml version="1.0" encoding="UTF-8"?><进程版本="9.9.002">
<参数key="logverbosity" value="init"/> <参数key="random_seed" value="-1"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="" 30"/> <参数key="encoding" value="SYSTEM"/> <进程expanded="true"> < 1
答案
德国多特蒙德
这就是我在python里的做法,
df('类型']= np.where (df.Notes.str.contains (r ' \ b(谎言| " |撒谎)\ b”),“谎言”,
不知道在这里该怎么做。