登录
注册
乐鱼官网手机版下载
解决方案
乐鱼体育安装
定价
合作伙伴
公司
你好,陌生人!
看起来你是新来的。登录或注册开始。
使用RapidMiner登录
使用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.5 k
所有类别
19.5 k
帮助
442
知识库
Altair RapidMiner社区
得到帮助。学习最佳实践。与你的同事建立联系。
讨论
如何获得朴素贝叶斯情感分析中的F_score
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:周一,今天,上周,3月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问一个问题
寻找有用的视频
首页
;
帮助
如何获得朴素贝叶斯情感分析中的F_score
HeikoeWin786
成员
职位:
64
因素二世
2020年7月
2020年7月编辑
在
帮助
亲爱的所有,
当我将性能矩阵(二项式)连接到模型时,我得到了一个错误。
我需要计算F_score,因为我的数据集是不平衡的。
我会非常感激
如果你们中有人遇到过这个问题,或者可以给我一些建议。
提前谢谢你,
问候,
Heikoe
标记:
情绪分析
朴素贝叶斯
0
最佳答案
jacobcybulski
委员、大学教授
职位:
391
独角兽
2020年7月
解决方案接受
是的,非常准确,你可以平衡训练集来避免模型偏差但你把模型应用到一个测试集它包含了代表总体的标签类的混合。只要确保如果你为训练做任何预处理,你将需要为测试集做完全相同的预处理(除了类平衡),使用训练运行的预处理模型(你可以保存它们,然后在以后检索它们)。
5
答案
Telcontar120
主持人,RapidMiner认证分析师,RapidMiner认证专家,会员
职位:
1635年
独角兽
2020年7月
这个错误告诉您,您的标签是多名的(意味着它有许多潜在的值),而不是二名的(意味着它只有两个值)。因此,您需要确保为这个性能操作符使用一个兼容的标签。
布莱恩·T。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
1
jacobcybulski
委员、大学教授
职位:
391
独角兽
2020年7月
您还可以使用正常的分类性能并度量Kappa,它也可以更好地处理不平衡的类分布。然而,在不平衡的标签类上训练的任何模型最终都可能偏向大多数类,因此性能度量可能无法解决您的问题。相反,你可以在模型训练之前尝试平衡你的类,例如使用SMOTE算子,然后将结果模型应用于具有原始类分布的测试集(以获得对模型性能的实际想法)。还要始终检查整个混淆矩阵,而不是单个值的性能度量。
1
HeikoeWin786
成员
职位:
64
因素二世
2020年7月
@jacobcybulski
你好Jacob,非常感谢你的解释。如果我没理解错的话,
1)检索训练数据集-> SMOTE ->预处理数据(将数据处理为文档)-> NBC ->存储模型
2)检索训练数据集->预处理数据(将数据处理到文档)->应用模型(我们在步骤1中存储的模型)
我说的对吗?
谢谢,
Heikoe
0
HeikoeWin786
成员
职位:
64
因素二世
2020年7月
@jacobcybulski
完全理解,雅各布。我会按建议去做。非常感谢你的时间和帮助。
问候,
Heikoe
0
登录
或
注册
置评。
答案
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
你好Jacob,非常感谢你的解释。如果我没理解错的话,
1)检索训练数据集-> SMOTE ->预处理数据(将数据处理为文档)-> NBC ->存储模型
2)检索训练数据集->预处理数据(将数据处理到文档)->应用模型(我们在步骤1中存储的模型)
我说的对吗?
谢谢,
Heikoe
完全理解,雅各布。我会按建议去做。非常感谢你的时间和帮助。
问候,
Heikoe