“情绪分析-选择正确的过程”

考斯塔斯。考斯塔斯。 成员职位:3.贡献我
2019年5月编辑 帮助
亲爱的所有,

我是数据挖掘这个奇妙世界的新手,我不得不说我印象深刻。我将试着用几句话来总结我的问题:

我有一个excel文件,有两列-> A列包含对某件事表达意见的短语(文本),B列有字符n或p,分别表示上述短语中的情绪是消极的或积极的。显然,p和n是我手工插入的。
(例如:这个网站很有帮助->p /这太糟糕了->n)

我想做的是使用上面提到的文件作为数据的训练集,并使用它来学习一个模型,以应用于其他数据(即对特定事项表达意见的类似短语)。我需要知道的是使用哪些操作员来建立所需的过程。

真的很期待你的支持,提前感谢你,
亲切的问候
标记:

答案

  • 考斯塔斯。考斯塔斯。 成员职位:3.贡献我
    谢谢你的回复。问题是,我已经看了你的帖子,虽然我能看到相似之处,但还是有很大的不同。我会尽量更好地解释我的目的。我有一个包含两列的excel表格,如下:

    一个B
    表达极性
    我对这种情况感到厌烦
    他们是白痴和无能
    这是非常有用的
    情况一天比一天糟
    我相信这是很好的一步
    ......................................

    同样,p代表积极的态度,n代表消极的态度,反映在A列的简短短语中。

    我的问题是应该使用哪个操作符来创建一个模型,该模型可以从上面提到的excel表中学习。
    然后,提到的模型将用于仅包含短语而不包含情感(极性)的excel表格。

    欢迎任何有建议的人....

    谢谢你!
  • el_chiefel_chief 成员职位:63Maven
    嘿,考斯塔斯。

    这基本上与我博客上的文本分析系列的视频5相同。

    你试着把这些短语分为消极的和积极的。这就是分类,分为两类。

    您需要创建一个单词向量,每个(唯一的)单词或n-gram都有一列,然后使用SVM这样的分类器来学习模型。
  • 考斯塔斯。考斯塔斯。 成员职位:3.贡献我
    你好,尼尔。

    正如你所看到的,我非常渴望找到一个解决方案,所以我也给你发了一封电子邮件。

    我不得不说你给的提示很有帮助,我离我的目标更近了。我真的很感激。

    我将尝试一些东西,如果有任何进一步的问题,我会回来。

    当然,任何人对这个问题的看法都是受欢迎的,我也期待着遇到这样的人

登录注册置评。