是否有可能获得100%的分割验证准确性?

Joannach0ngJoannach0ng 成员职位:7学我
2019年7月编辑 帮助
是否有可能获得100%的分割验证准确性以及获得100%准确性的优点是什么?谢谢
标记:

答案

  • jmerglerjmergler 管理员、版主、员工、RapidMiner认证分析师、会员、大学教授职位:35大师
    @Joannach0ng
    在我看来,大多数时候这是令人担忧的。对于某些问题,这是可能的,但对于大多数实际业务问题,这是不可能的。一个可能有用的参考点是问,“如果一个专家团队仔细研究数据,他们的预测能力有多好?”这有时会给你一个好的精确度的概念。对于一些简单的问题,它可能接近或100%,但对于商业中的许多问题,它根本不会接近。

    如果你有100%的准确率,我会检查那些与结果过于密切相关的属性;它们可能包含在观察到结果之后才可用的信息。在本课程中有更多关于正确验证的信息:https://academy.www.turtlecreekpls.com/learn/course/applications-use-cases-professional/

    我建议你花点时间把这门课过一遍。同样,如果您已经得出了100%的准确性,您是否能够分享更多关于用例和数据,或者您正在使用的流程的信息?我们也许能提供更好的帮助。
    varunm1 Tghadially
  • rfuentealbarfuentealba 主持人,RapidMiner认证分析师,会员,大学教授职位:568独角兽
    如果遇到此问题,请检查是否在数据源中包含了任何ID。当您使用决策树(或其他基于树的算法)时尤其如此:树试图过拟合,识别行的最佳方法成为ID,因此您的算法没有用,因为在生产中每一行都有一个看不见的ID。

    我的两分钱。
    varunm1 Tghadially
  • Joannach0ngJoannach0ng 成员职位:7学我
    @jmergler你好,谢谢你的回复!其实我的导师告诉我要有100%的预测准确率,所以我想知道是否可以,因为我从0-1开始尝试,但可以达到100%,是否可以增加一些算子?谢谢!
  • Joannach0ngJoannach0ng 成员职位:7学我
    @rfuentealba你好,谢谢你的回复!实际上我的导师告诉我要有100%的准确率预测,所以我想知道是否有可能,因为我已经从0-1尝试过了,但是我可以通过添加一些算子来达到100%的准确率吗?谢谢!
  • kypexinkypexin 主持人,RapidMiner认证分析师,会员职位:290独角兽
    @Joannach0ng

    我在冒着被别人指责教你坏事的风险笑脸:但从技术上讲,你可以这样做,如果你在完全相同的数据集上训练和测试模型:


    但是,考虑到其他评论者的担忧,因为这件事:
    • 对于现实生活/机器学习问题没有意义。
    • 从数据科学的角度来看,这是一个严重的错误。乐鱼平台进入
    你确定这就是导师问你的问题吗?如果是,我建议你研究这个问题,并说服你的导师这是一件完全错误的事情。
    --
    弗拉基米尔•
    http://whatthefraud.wtf
    Tghadially varunm1
  • varunm1varunm1 主持人,职位:1207年独角兽
    @kypexin您的解决方案完全符合导师的要求眨眼:
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    kypexin Tghadially
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    我想在这里重申许多注意事项——在现实生活中,任何测试数据集上100%的准确性几乎总是一个指标,表明存在一些性能泄漏——一个id,或标签的代理,在预测时并不真正可用。它应该被非常怀疑地看待,而不是作为一个现实的目标。

    一个可能的例外是,如果您在测试数据集中有少量的示例,但在模型中有大量的属性,在这种情况下,您的模型可能会“过度指定”(基本上太多的属性将导致一些独特的组合,作为一种id来进行预测)。或者如果你在测试集中只有太少的例子(例如,想象一个测试用例的减少,那么它要么是100%准确,要么是0%!),这也可能是随机发生的。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    Tghadially
  • rfuentealbarfuentealba 主持人,RapidMiner认证分析师,会员,大学教授职位:568独角兽
    既然你提到了,几年前我曾经有过一个要求。我甚至都不存在。如果你熟悉逻辑门,你就会知道它们是如何工作的。否则,就有解释了在这里

    问题是,我有一个数据集,其中有12个属性是这样工作的(为了降低复杂性,我将使用OR逻辑门来解释):

    A1 a2 ax
    0 0 0 0
    0 1
    1 0 1
    1 1
    1 1 1

    我们的想法是真正构建一个可以像那样运行的程序,因为这个程序是用C语言编译的,没有源代码,编译它的逻辑控制器需要替换。我最终训练了一棵决策树,因为我不知道逻辑门的顺序是什么,而逻辑控制器最终是一台旧电脑。

    这不是最优雅的解决方案,但对数据科学来说是一个巨大的胜利。乐鱼平台进入

    愿一切都好!

    罗德里戈。
    Tghadially
登录注册置评。