有网格搜索的分类器精度与没有网格搜索的分类器精度不相似
你好,伙计们,当过程结束时,我正在进行网格搜索以调整随机森林参数,它为我提供了一组最佳参数以及RF最佳参数的准确性,现在我的问题是,当我通过设置我从网格搜索中获得的随机森林参数来运行没有网格搜索的过程时,我注意到我得到了降级精度??有人可以解释的差异,因为这两种方法是相同的,唯一的区别是,第一种方法是网格搜索和第二次没有网格搜索?
我已经包括了我的过程的截图
我的数据集是214个样本的玻璃类型,它包含1个重复行,6类不平衡数据,我运行我的过程如下
将数据集发送到优化参数(网格)操作符
内部优化参数(网格)操作符:
1-删除重复项
2 -正常化
3-将数据分割成80:20
只对训练数据使用Smote
5-列车RF
6-评估模型
我已经包括了我的过程的截图
我的数据集是214个样本的玻璃类型,它包含1个重复行,6类不平衡数据,我运行我的过程如下
将数据集发送到优化参数(网格)操作符
内部优化参数(网格)操作符:
1-删除重复项
2 -正常化
3-将数据分割成80:20
只对训练数据使用Smote
5-列车RF
6-评估模型
0
答案
分层抽样产生随机子集。
我建议您使用拆分操作符一次,存储结果,然后在比较中使用新的示例集。
最好的
塞萨尔
我按照您说的做了拆分数据,然后将结果存储到两个单独的文件中。
之后,我运行网格搜索并获得最佳参数和精度。
然后我在没有网格搜索的情况下进行测试,但我仍然得到了一个降级的准确性??
请检查我的截图,告诉我,如果我做错了什么??
我只用过一次smote,
我也删除了smote,并且在不使用分割运算符的情况下再次测试,我仍然得到了降级的精度,我认为在网格搜索中使用性能运算符和不使用网格搜索会产生稍微不同的结果,谢谢
致以最亲切的问候