评估文本
最好的答案
-
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:828独角兽嗨@MarkusW,
RapidMiner有一个市场,你可以在菜单中找到(“扩展”)。在那里你会发现文本处理和Web挖掘扩展。
学院里有一门完整的文本挖掘课程:
https://academy.www.turtlecreekpls.com/courses/text-and-web-mining-with-rapidminer
问候,
Balazs1 -
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:828独角兽这就跟你问声好!
是的,讽刺检测是一个很大的挑战,简单的模型无法胜任。
你在学院的课程里看过“文件自动分类”吗?
它解释了Process Documents操作符。您在这里需要添加的唯一内容是“生成n-Grams(术语)”。这将创建新的术语组合属性,如“不太好”和“我真的很喜欢它”。当然,后续单词的所有组合都将被创建,因此这为您提供了大量的新属性。这也许能帮到你的讽刺。
朴素贝叶斯和支持向量机是非常适合这种情况的建模算法。其他算法需要很长时间,在这类数据上表现不佳,深度学习可能是个例外,但你需要大量的资源来执行。乐鱼体育安装
问候,
Balazs0
答案
语义云文本分析
提取内容是在Web挖掘扩展。
在操作符工具箱中,您有两个与情绪相关的操作符,它们在某些条件下(语言等)工作。你可以看一下。
如果它们对你的内容不够好,你需要使用Academy课程中的方法自己建立一个情感模型。情感将是这里的标签;如果你还没有标签,你需要自己为几百个典型文本打分,并使用手动分配的情感作为标签。然后在第一步中预测情绪,将结果更改为普通属性,然后将标签与这个新属性一起使用。
“分析内容”是一种非常类似人类的活动。文本挖掘方法通过查看术语或术语的组合来工作。您可以完全控制RapidMiner中的进程,或者使用外部服务在后台执行类似的操作。
问候,
Balazs
如果你想在你的数据中检测讽刺,但你没有标签数据,那么你不能在这里使用经典数据挖掘。
你也许可以找到一家提供讽刺检测服务的公司,并使用它。或者如果你真的需要一个公司,你可以找一些助手来标记几百个文档/文本,这样你就可以引导一个模型。
当你有一个标记的数据集时,RapidMiner将帮助你。文本挖掘操作符在学院文本挖掘课程中有描述。您可以在此过程中使用术语(n-grams)。
问候,
Balazs