登录
注册
乐鱼官网手机版下载
解决方案
乐鱼体育安装
定价
合作伙伴
公司
你好,陌生人!
看起来你是新来的。登录或注册开始。
使用RapidMiner登录
使用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.5 k
所有类别
19.6 k
帮助
442
知识库
Altair RapidMiner社区
得到帮助。学习最佳实践。与你的同事建立联系。
讨论
是否有可能获得100%的分割验证准确性?
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:周一,今天,上周,3月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问一个问题
寻找有用的视频
首页
;
帮助
是否有可能获得100%的分割验证准确性?
Joannach0ng
成员
职位:
7
学我
2019年7月
2019年7月编辑
在
帮助
是否有可能获得100%的分割验证准确性以及获得100%准确性的优点是什么?谢谢
标记:
性能
分裂
0
答案
jmergler
管理员、版主、员工、RapidMiner认证分析师、会员、大学教授
职位:
35
大师
2019年7月
嗨
@Joannach0ng
,
在我看来,大多数时候这是令人担忧的。对于某些问题,这是可能的,但对于大多数实际业务问题,这是不可能的。一个可能有用的参考点是问,“如果一个专家团队仔细研究数据,他们的预测能力有多好?”这有时会给你一个好的精确度的概念。对于一些简单的问题,它可能接近或100%,但对于商业中的许多问题,它根本不会接近。
如果你有100%的准确率,我会检查那些与结果过于密切相关的属性;它们可能包含在观察到结果之后才可用的信息。在本课程中有更多关于正确验证的信息:
https://academy.www.turtlecreekpls.com/learn/course/applications-use-cases-professional/
我建议你花点时间把这门课过一遍。同样,如果您已经得出了100%的准确性,您是否能够分享更多关于用例和数据,或者您正在使用的流程的信息?我们也许能提供更好的帮助。
2
rfuentealba
主持人,RapidMiner认证分析师,会员,大学教授
职位:
568
独角兽
2019年7月
如果遇到此问题,请检查是否在数据源中包含了任何ID。当您使用决策树(或其他基于树的算法)时尤其如此:树试图过拟合,识别行的最佳方法成为ID,因此您的算法没有用,因为在生产中每一行都有一个看不见的ID。
我的两分钱。
2
Joannach0ng
成员
职位:
7
学我
2019年8月
@jmergler
你好,谢谢你的回复!其实我的导师告诉我要有100%的预测准确率,所以我想知道是否可以,因为我从0-1开始尝试,但可以达到100%,是否可以增加一些算子?谢谢!
0
Joannach0ng
成员
职位:
7
学我
2019年8月
@rfuentealba
你好,谢谢你的回复!实际上我的导师告诉我要有100%的准确率预测,所以我想知道是否有可能,因为我已经从0-1尝试过了,但是我可以通过添加一些算子来达到100%的准确率吗?谢谢!
0
kypexin
主持人,RapidMiner认证分析师,会员
职位:
290
独角兽
2019年8月
嗨
@Joannach0ng
我在冒着被别人指责教你坏事的风险
但从技术上讲,你可以这样做,如果你在完全相同的数据集上训练和测试模型:
但是,考虑到其他评论者的担忧,因为这件事:
对于现实生活/机器学习问题没有意义。
从数据科学的角度来看,这是一个严重的错误。乐鱼平台进入
你确定这就是导师问你的问题吗?如果是,我建议你研究这个问题,并说服你的导师这是一件完全错误的事情。
--
弗拉基米尔•
http://whatthefraud.wtf
2
varunm1
主持人,
职位:
1207年
独角兽
2019年8月
@kypexin
您的解决方案完全符合导师的要求
问候,
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
2
Telcontar120
主持人,RapidMiner认证分析师,RapidMiner认证专家,会员
职位:
1635年
独角兽
2019年8月
我想在这里重申许多注意事项——在现实生活中,任何测试数据集上100%的准确性几乎总是一个指标,表明存在一些性能泄漏——一个id,或标签的代理,在预测时并不真正可用。它应该被非常怀疑地看待,而不是作为一个现实的目标。
一个可能的例外是,如果您在测试数据集中有少量的示例,但在模型中有大量的属性,在这种情况下,您的模型可能会“过度指定”(基本上太多的属性将导致一些独特的组合,作为一种id来进行预测)。或者如果你在测试集中只有太少的例子(例如,想象一个测试用例的减少,那么它要么是100%准确,要么是0%!),这也可能是随机发生的。
布莱恩·T。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
1
rfuentealba
主持人,RapidMiner认证分析师,会员,大学教授
职位:
568
独角兽
2019年8月
既然你提到了,几年前我曾经有过一个要求。我甚至都不存在。如果你熟悉逻辑门,你就会知道它们是如何工作的。否则,就有解释了
在这里
.
问题是,我有一个数据集,其中有12个属性是这样工作的(为了降低复杂性,我将使用OR逻辑门来解释):
A1 a2 ax
0 0 0 0
0 1
1 0 1
1 1
1 1 1
我们的想法是真正构建一个可以像那样运行的程序,因为这个程序是用C语言编译的,没有源代码,编译它的逻辑控制器需要替换。我最终训练了一棵决策树,因为我不知道逻辑门的顺序是什么,而逻辑控制器最终是一台旧电脑。
这不是最优雅的解决方案,但对数据科学来说是一个巨大的胜利。乐鱼平台进入
愿一切都好!
罗德里戈。
1
登录
或
注册
置评。
答案
在我看来,大多数时候这是令人担忧的。对于某些问题,这是可能的,但对于大多数实际业务问题,这是不可能的。一个可能有用的参考点是问,“如果一个专家团队仔细研究数据,他们的预测能力有多好?”这有时会给你一个好的精确度的概念。对于一些简单的问题,它可能接近或100%,但对于商业中的许多问题,它根本不会接近。
如果你有100%的准确率,我会检查那些与结果过于密切相关的属性;它们可能包含在观察到结果之后才可用的信息。在本课程中有更多关于正确验证的信息:https://academy.www.turtlecreekpls.com/learn/course/applications-use-cases-professional/
我建议你花点时间把这门课过一遍。同样,如果您已经得出了100%的准确性,您是否能够分享更多关于用例和数据,或者您正在使用的流程的信息?我们也许能提供更好的帮助。
我的两分钱。
我在冒着被别人指责教你坏事的风险但从技术上讲,你可以这样做,如果你在完全相同的数据集上训练和测试模型:
但是,考虑到其他评论者的担忧,因为这件事:
弗拉基米尔•
http://whatthefraud.wtf
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
一个可能的例外是,如果您在测试数据集中有少量的示例,但在模型中有大量的属性,在这种情况下,您的模型可能会“过度指定”(基本上太多的属性将导致一些独特的组合,作为一种id来进行预测)。或者如果你在测试集中只有太少的例子(例如,想象一个测试用例的减少,那么它要么是100%准确,要么是0%!),这也可能是随机发生的。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
问题是,我有一个数据集,其中有12个属性是这样工作的(为了降低复杂性,我将使用OR逻辑门来解释):
这不是最优雅的解决方案,但对数据科学来说是一个巨大的胜利。乐鱼平台进入