交叉验证功能

JohnNash2000JohnNash2000 成员职位:2新手
你好,我目前正在进行交叉验证(CV),在这个过程中,“向前选择”是在培训期间执行的。简历完成后,我如何输出所选的特征?我尝试了无数的解决方案,包括使用“数据权重”和“数据权重”操作符,但这些都没有输出所选的功能。有人知道我如何从“交叉验证”过程中提取所选的特征吗?

谢谢你!

最佳答案

答案

  • JohnNash2000JohnNash2000 成员职位:2新手
    你好@varunm1

    你是100%正确的,没有最终的功能集,因为CV的每次迭代都会有自己的功能集。你看,我最近读了一篇关于污染的博文(“避免意外污染数据[3个例子]”),所以我把我的功能选择过程从简历外部转移到内部。当特征选择过程在外部时,我根据整个训练数据选择了一组特征。这就是我一直在寻找的东西,我在寻找的过程中变得如此盲目如何为了做这件事,我从来没有停下来思考过为什么。

    谢谢你!



    (删除用户)
  • varunm1varunm1 主持人,职位:1207年独角兽
    这是真实的@JohnNash2000如果我们正在验证一个模型,那么采样、特征选择等预处理步骤应该应用于训练端。如果我们应用于整个数据,它会使模型产生偏差,有时会超出对性能的估计。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

登录注册置评。