为什么朴素贝叶斯对每个样本都返回0或1的置信度?

fstarsinicfstarsinic 成员职位:20.因素二世
2020年4月编辑 帮助
我只是猜测,但这是告诉我,有一些属性的算法是关键和丢弃其他一切?有没有一种方法可以把结果和预测+其他属性一起放在一个相关矩阵中,看看情况是否如此?我无法用NB来描述它。看起来更像是神经网络或树的东西。

不管怎样,只有0和1 ?这可不是什么好兆头。这说明了什么?

答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年4月编辑
    有没有一种方法可以把结果和预测+其他属性一起放在一个相关矩阵中,看看情况是否如此

    如果我理解正确的话,您希望找到预测输出和模型中使用的常规属性之间的相关性。如果是这样,是的,您可以使用相关矩阵运算符并将其连接到性能运算符到相关矩阵的“exa”端口,并在相关矩阵运算符中选择“包含特殊属性”选项。



    另外,性能指标表明了什么?这个模型的预测精度高吗?

    如果您需要更多信息,请告诉我们。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

  • fstarsinicfstarsinic 成员职位:20.因素二世
    谢谢你!结果并不可怕。很多预测让我很开心,这很好。正如我所料,预测是有道理的。我有一个非常不平衡的数据集,所以一些统计数据没有那么有意义。
    varunm1
  • fstarsinicfstarsinic 成员职位:20.因素二世

    这就是我觉得奇怪的地方。这里只有几个测试样本,但无论样本大小,结果都是一样的。置信度(预测0或1)总是0%或100%。好像出了什么问题。
  • varunm1varunm1 主持人,职位:1207年独角兽
    你确定它总是0和1吗?根据这张图,我看到它们中的一些小于1大于0。您是否可以检查数据视图而不是统计视图,或者您可以打开图表?
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

  • fstarsinicfstarsinic 成员职位:20.因素二世

    是的,信心都是0或15分,别无其他。我检查了数据。这里有一个例子。
    上面的纵轴是样本数量。横轴表示不同的置信值(只有2)
  • varunm1varunm1 主持人,职位:1207年独角兽
    哦,所以算法不会学习第0类。零类的精度值是多少?这种情况有时会发生在高度不平衡的数据集上,算法只是将所有内容推到具有高样本的类中。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

  • fstarsinicfstarsinic 成员职位:20.因素二世
    因为只有两个类所以如果它学习了类1它不也会自动学习类0吗?
  • varunm1varunm1 主持人,职位:1207年独角兽
    2020年4月编辑
    我说的不学习是什么意思?在朴素贝叶斯的情况下,它假设所有的属性都是相互独立的(这有时有效,有时无效)。如果你的数据在属性之间有复杂的相互作用,给模型增加了更多的信息,朴素贝叶斯就不能找到这些东西,因为它是基于条件独立性的(一个属性和另一个属性没有连接)。当它学习失败时,这些算法将把所有或大多数样本预测为多数类(在你的例子中是1)。我猜你的数据就是这个算法原理失效的一个例子。数据不平衡也会对这些算法产生巨大影响。

    机器学习也是基于没有免费的午餐定理。我们永远不知道哪种算法适合我们的数据,这就是我们尝试应用多个模型的原因。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    lionelderkrikor
  • MarcoBarradasMarcoBarradas 管理员,员工,RapidMiner认证分析师,会员职位:266独角兽
    fstarsinic你说“我有一个非常不平衡的数据集”,你在应用你的学习器之前完成了所有的预处理和采样吗?如果你没有这样做,模型是有偏差的,因为它更容易预测在你的数据集中有更多值的类,所以它需要你的帮助。

    你可能会在这个视频中看到它的影响以及如何解决它。

    https://academy.www.turtlecreekpls.com/learn/video/sampling-weighting-intro
    https://academy.www.turtlecreekpls.com/learn/video/sampling-weighting-demo

    对于天真的人
    https://academy.www.turtlecreekpls.com/learn/video/naive-bayes-intro
    https://academy.www.turtlecreekpls.com/courses/nave-bayes-demo


    varunm1 lionelderkrikor
登录注册置评。