如何获得朴素贝叶斯情感分析中的F_score

HeikoeWin786HeikoeWin786 成员职位:64因素二世
2020年7月编辑 帮助
亲爱的所有,

当我将性能矩阵(二项式)连接到模型时,我得到了一个错误。
我需要计算F_score,因为我的数据集是不平衡的。
我会非常感激如果你们中有人遇到过这个问题,或者可以给我一些建议。

提前谢谢你,
问候,
Heikoe

最佳答案

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    这个错误告诉您,您的标签是多名的(意味着它有许多潜在的值),而不是二名的(意味着它只有两个值)。因此,您需要确保为这个性能操作符使用一个兼容的标签。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    HeikoeWin786
  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    您还可以使用正常的分类性能并度量Kappa,它也可以更好地处理不平衡的类分布。然而,在不平衡的标签类上训练的任何模型最终都可能偏向大多数类,因此性能度量可能无法解决您的问题。相反,你可以在模型训练之前尝试平衡你的类,例如使用SMOTE算子,然后将结果模型应用于具有原始类分布的测试集(以获得对模型性能的实际想法)。还要始终检查整个混淆矩阵,而不是单个值的性能度量。
    HeikoeWin786
  • HeikoeWin786HeikoeWin786 成员职位:64因素二世
    @jacobcybulski

    你好Jacob,非常感谢你的解释。如果我没理解错的话,
    1)检索训练数据集-> SMOTE ->预处理数据(将数据处理为文档)-> NBC ->存储模型
    2)检索训练数据集->预处理数据(将数据处理到文档)->应用模型(我们在步骤1中存储的模型)

    我说的对吗?

    谢谢,
    Heikoe
  • HeikoeWin786HeikoeWin786 成员职位:64因素二世
    @jacobcybulski

    完全理解,雅各布。我会按建议去做。非常感谢你的时间和帮助。

    问候,
    Heikoe
登录注册置评。