我需要一个操作符,如过滤停止词(字典)操作符的逆

FatmahFatmah 成员职位:6贡献我
2019年7月编辑 帮助

谢谢你阅读我的文章

我在我的硕士论文工作,我发现同样我的问题在这里这个链接

http://community.www.turtlecreekpls.com/t5/RapidMiner-Studio/SOLVED-Filter-text-from-a-list-of-word/td-p/21459

他通过修改字典的代码来解决这个问题。

我读了文档“如何扩展rapidminer”

我通过下载Java和Eclipse Java Neon来准备环境

我现在知道如何创建自己的操作符,但我不知道如何复制现有的操作符代码和修改它?

再次感谢

答案

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,会员职位:1761年独角兽

    你检查了字典操作符过滤Stopwords吗?在那里,您可以为停止词提供一个自定义txt文件。

  • FatmahFatmah 成员职位:6贡献我
    你好,托马斯。
    谢谢回放
    是的,我查过很多次了
    操作符将从文本文件中的单词中过滤出文档
    我想让过滤器过滤文档中的所有单词,除了文本文件中的单词
    我需要的恰恰相反。
  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,会员职位:1761年独角兽

    按内容过滤有帮助吗?它有一个逆条件。那么POS标签过滤呢?它也有一个逆条件。

  • FatmahFatmah 成员职位:6贡献我

    我尝试过滤的内容,但这是不足以为我的情况,因为文本文件有几十个字
    根据内容进行过滤将适合于非常少量的表达式
    在过滤POS标签?我不能决定我想要的词!

    再次感谢您的帮助,如果您有任何建议,请告诉我,或者如果您知道我如何才能找到代码?

  • hmhsinghmhsing 成员职位:24Maven
    我将字典txt文件更改为Excel,然后使用过滤器令牌使用示例集(需要检查反向过滤器),它的工作。见附件。
  • kaymankayman 成员职位:662独角兽
    理论上,您可以使用数据操作符中的流程文档,并使用反向停止列表(或白列表)作为单词列表,这将只允许列表中的单词是可接受的。没有真正的开箱即用的操作符来创建你自己的单词列表,但这个更详细:

    https://community.www.turtlecreekpls.com/discussion/35707/creating-a-comparing-white-list-of-words-to-a-wordlist-from-a-data-mined-webpage
登录注册置评。