如何使用过滤器停止词(字典)在rapidminer ?

ikayunida123ikayunida123 成员职位:17因素二世
2020年6月编辑 帮助

你好!我对rapidminer很陌生,现在我正在为班级的家庭作业做一个文本挖掘项目。

我想知道如何使用过滤停止词(字典),因为我找不到任何教程。我选择使用这个操作符是因为rapidminer不支持我的语言(印尼语)。

我已经在这个论坛读到一些关于过滤器停止词(字典)的其他问题,但我真的不理解,因为他们使用XML脚本。老实说,我对XML一无所知。

我是否需要XML文本使用过滤器停止词(字典)?或者我只是可以使用它通过导入纯文本(有stopwords列表)到rapidminer?

我需要你的帮助。谢谢你!

最佳答案

  • Telcontar120Telcontar120 版主,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    解决方案接受

    您可以只用Filter Stopwords (Dictionary)操作符导入一个纯文本文件。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    ikayunida123 AlmuVT

答案

  • HyramHyram 成员职位:39因素二世
    你好。我们如何排除RapidMiner使用的一些停止词?我对目前的列表很满意,但需要排除的只有一两个词。
    谢谢
  • Telcontar120Telcontar120 版主,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    最简单的方法是创建自己的Stopword列表(基于RapidMiner列表并删除你不想要的),然后使用Filter Stopword(字典)操作符。无法有选择地为其他停止词操作符使用列表。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • 肯锡肯锡 成员职位:1新手
    大家好。这可能是一个愚蠢的问题,但是在哪里可以找到Filter Stopwords (Dictionary)操作符的纯文本文件呢?该操作符的参数部分为空。我在哪里可以找到它,或者我如何导入它?谢谢!
登录注册置评。