登录
注册
乐鱼官网手机版下载
解决方案
乐鱼体育安装
定价
合作伙伴
公司
你好,陌生人!
看起来你是新来的。登录或注册开始。
使用RapidMiner登录
使用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.5 k
所有类别
19.5 k
帮助
442
知识库
Altair RapidMiner社区
得到帮助。学习最佳实践。与你的同事建立联系。
讨论
为什么朴素贝叶斯对每个样本都返回0或1的置信度?
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:周一,今天,上周,3月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问一个问题
寻找有用的视频
首页
;
帮助
为什么朴素贝叶斯对每个样本都返回0或1的置信度?
fstarsinic
成员
职位:
20.
因素二世
2020年4月
2020年4月编辑
在
帮助
我只是猜测,但这是告诉我,有一些属性的算法是关键和丢弃其他一切?有没有一种方法可以把结果和预测+其他属性一起放在一个相关矩阵中,看看情况是否如此?我无法用NB来描述它。看起来更像是神经网络或树的东西。
不管怎样,只有0和1 ?这可不是什么好兆头。这说明了什么?
标记:
性能
抽样
朴素贝叶斯
0
答案
varunm1
主持人,
职位:
1207年
独角兽
2020年4月
2020年4月编辑
有没有一种方法可以把结果和预测+其他属性一起放在一个相关矩阵中,看看情况是否如此
如果我理解正确的话,您希望找到预测输出和模型中使用的常规属性之间的相关性。如果是这样,是的,您可以使用相关矩阵运算符并将其连接到性能运算符到相关矩阵的“exa”端口,并在相关矩阵运算符中选择“包含特殊属性”选项。
另外,性能指标表明了什么?这个模型的预测精度高吗?
如果您需要更多信息,请告诉我们。
问候,
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
0
fstarsinic
成员
职位:
20.
因素二世
2020年4月
谢谢你!结果并不可怕。很多预测让我很开心,这很好。正如我所料,预测是有道理的。我有一个非常不平衡的数据集,所以一些统计数据没有那么有意义。
1
fstarsinic
成员
职位:
20.
因素二世
2020年4月
这就是我觉得奇怪的地方。这里只有几个测试样本,但无论样本大小,结果都是一样的。置信度(预测0或1)总是0%或100%。好像出了什么问题。
0
varunm1
主持人,
职位:
1207年
独角兽
2020年4月
你确定它总是0和1吗?根据这张图,我看到它们中的一些小于1大于0。您是否可以检查数据视图而不是统计视图,或者您可以打开图表?
问候,
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
0
fstarsinic
成员
职位:
20.
因素二世
2020年4月
是的,信心都是0或15分,别无其他。我检查了数据。这里有一个例子。
上面的纵轴是样本数量。横轴表示不同的置信值(只有2)
0
varunm1
主持人,
职位:
1207年
独角兽
2020年4月
哦,所以算法不会学习第0类。零类的精度值是多少?这种情况有时会发生在高度不平衡的数据集上,算法只是将所有内容推到具有高样本的类中。
问候,
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
0
fstarsinic
成员
职位:
20.
因素二世
2020年4月
因为只有两个类所以如果它学习了类1它不也会自动学习类0吗?
0
varunm1
主持人,
职位:
1207年
独角兽
2020年4月
2020年4月编辑
我说的不学习是什么意思?在朴素贝叶斯的情况下,它假设所有的属性都是相互独立的(这有时有效,有时无效)。如果你的数据在属性之间有复杂的相互作用,给模型增加了更多的信息,朴素贝叶斯就不能找到这些东西,因为它是基于条件独立性的(一个属性和另一个属性没有连接)。当它学习失败时,这些算法将把所有或大多数样本预测为多数类(在你的例子中是1)。我猜你的数据就是这个算法原理失效的一个例子。数据不平衡也会对这些算法产生巨大影响。
机器学习也是基于没有免费的午餐定理。我们永远不知道哪种算法适合我们的数据,这就是我们尝试应用多个模型的原因。
问候,
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
1
MarcoBarradas
管理员,员工,RapidMiner认证分析师,会员
职位:
266
独角兽
2020年4月
fstarsinic
你说“我有一个非常不平衡的数据集”,你在应用你的学习器之前完成了所有的预处理和采样吗?如果你没有这样做,模型是有偏差的,因为它更容易预测在你的数据集中有更多值的类,所以它需要你的帮助。
你可能会在这个视频中看到它的影响以及如何解决它。
https://academy.www.turtlecreekpls.com/learn/video/sampling-weighting-intro
https://academy.www.turtlecreekpls.com/learn/video/sampling-weighting-demo
对于天真的人
https://academy.www.turtlecreekpls.com/learn/video/naive-bayes-intro
https://academy.www.turtlecreekpls.com/courses/nave-bayes-demo
2
登录
或
注册
置评。
答案
如果我理解正确的话,您希望找到预测输出和模型中使用的常规属性之间的相关性。如果是这样,是的,您可以使用相关矩阵运算符并将其连接到性能运算符到相关矩阵的“exa”端口,并在相关矩阵运算符中选择“包含特殊属性”选项。
另外,性能指标表明了什么?这个模型的预测精度高吗?
如果您需要更多信息,请告诉我们。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
这就是我觉得奇怪的地方。这里只有几个测试样本,但无论样本大小,结果都是一样的。置信度(预测0或1)总是0%或100%。好像出了什么问题。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
是的,信心都是0或15分,别无其他。我检查了数据。这里有一个例子。
上面的纵轴是样本数量。横轴表示不同的置信值(只有2)
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
机器学习也是基于没有免费的午餐定理。我们永远不知道哪种算法适合我们的数据,这就是我们尝试应用多个模型的原因。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
你可能会在这个视频中看到它的影响以及如何解决它。
https://academy.www.turtlecreekpls.com/learn/video/sampling-weighting-intro
https://academy.www.turtlecreekpls.com/learn/video/sampling-weighting-demo
对于天真的人
https://academy.www.turtlecreekpls.com/learn/video/naive-bayes-intro
https://academy.www.turtlecreekpls.com/courses/nave-bayes-demo