“情绪分析-选择正确的过程”
亲爱的所有,
我是数据挖掘这个奇妙世界的新手,我不得不说我印象深刻。我将试着用几句话来总结我的问题:
我有一个excel文件,有两列-> A列包含对某件事表达意见的短语(文本),B列有字符n或p,分别表示上述短语中的情绪是消极的或积极的。显然,p和n是我手工插入的。
(例如:这个网站很有帮助->p /这太糟糕了->n)
我想做的是使用上面提到的文件作为数据的训练集,并使用它来学习一个模型,以应用于其他数据(即对特定事项表达意见的类似短语)。我需要知道的是使用哪些操作员来建立所需的过程。
真的很期待你的支持,提前感谢你,
亲切的问候
我是数据挖掘这个奇妙世界的新手,我不得不说我印象深刻。我将试着用几句话来总结我的问题:
我有一个excel文件,有两列-> A列包含对某件事表达意见的短语(文本),B列有字符n或p,分别表示上述短语中的情绪是消极的或积极的。显然,p和n是我手工插入的。
(例如:这个网站很有帮助->p /这太糟糕了->n)
我想做的是使用上面提到的文件作为数据的训练集,并使用它来学习一个模型,以应用于其他数据(即对特定事项表达意见的类似短语)。我需要知道的是使用哪些操作员来建立所需的过程。
真的很期待你的支持,提前感谢你,
亲切的问候
标记:
0
答案
一个B
表达极性
我对这种情况感到厌烦
他们是白痴和无能
这是非常有用的
情况一天比一天糟
我相信这是很好的一步
......................................
同样,p代表积极的态度,n代表消极的态度,反映在A列的简短短语中。
我的问题是应该使用哪个操作符来创建一个模型,该模型可以从上面提到的excel表中学习。
然后,提到的模型将用于仅包含短语而不包含情感(极性)的excel表格。
欢迎任何有建议的人....
谢谢你!
这基本上与我博客上的文本分析系列的视频5相同。
你试着把这些短语分为消极的和积极的。这就是分类,分为两类。
您需要创建一个单词向量,每个(唯一的)单词或n-gram都有一列,然后使用SVM这样的分类器来学习模型。
正如你所看到的,我非常渴望找到一个解决方案,所以我也给你发了一封电子邮件。
我不得不说你给的提示很有帮助,我离我的目标更近了。我真的很感激。
我将尝试一些东西,如果有任何进一步的问题,我会回来。
当然,任何人对这个问题的看法都是受欢迎的,我也期待着遇到这样的人