语言过滤器只保留英语
最好的答案
-
Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽理论上,您可以基于空格进行标记,这将为您提供一组可能使用多种语言的“单词”。然后,您可以使用带有字典操作符的过滤器令牌来仅保留给定语言字典中的那些令牌(您需要以txt文件的形式提供)。这将是一种仅使用本地RapidMiner操作符的粗语言过滤器,但我认为由于模糊的单词以及您对潜在混合语言文本的处理,准确性不会像您希望的那样高。6
-
JamieLim 成员职位:3.新手
答案
-手动对一组文档进行分类,并训练ML模型来区分它们,然后将该模型应用于所有新文档。
-使用外部API(如Google Translate或AWS Translate)为您完成此操作
斯科特
或者换句话说,有时候没有快速而肮脏的答案。
斯科特