在特性选择过程中耗尽特性

kypexinkypexin 主持人,RapidMiner认证分析师,会员职位:290独角兽
2019年7月编辑 帮助
你好,

在使用GLM学习器内部的FEATURE SELECTION算子时,我一次又一次地遇到同样的错误。它一开始有56个功能,每次我试图运行这个过程时,它的功能就会很快用完。


这些是GLM设置:


这些是功能选择设置:


请建议。如果需要的话,我也可以提供更多的信息。

谢谢!
--
弗拉基米尔•
http://whatthefraud.wtf
Tghadially

最佳答案

答案

  • kypexinkypexin 主持人,RapidMiner认证分析师,会员职位:290独角兽
    谢谢@IngoRM

    我认为我不应该有固定的特征,因为这些特征在清理数据之前就被删除了。至于共线性,我需要再检查一遍;无论如何,我也会尝试取消选中相应的选项。
    --
    弗拉基米尔•
    http://whatthefraud.wtf
    IngoRM Tghadially
  • kypexinkypexin 主持人,RapidMiner认证分析师,会员职位:290独角兽
    @IngoRM

    我回到这个线程,因为我再次面临这个问题。
    以前我禁止通过嵌套的GLM删除共线列,这很有帮助,所以它很有帮助,这个过程工作得很好。
    这次我又遇到了它,发现在过滤了较小的子集进行特征选择后,我的数据中实际上有一个常数列。

    因此我的问题,不能功能选择操作符只是忽略这样的列,因为它可能最终发生在我的情况下,但错误信息本身似乎太混乱了吗?

    谢谢!:)
    --
    弗拉基米尔•
    http://whatthefraud.wtf
    Tghadially
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人

    是的,错误信息确实很糟糕。不幸的是,我们对此无能为力,因为我们并不“拥有”这部分代码……我个人对这里不断的处理有点恼火。如果我们把它保留在里面,我们就避免了这个特殊情况下的错误但这让我很困惑一个特征选择,它应该去掉弱特征,强制保持恒定列。这有点违背目的....也因为它真的是没有记录的/ H2O学习器的特殊行为,我们需要解决这个问题…

    所以我实际上更喜欢保持它的方式,但这需要你之前使用Remove无用属性操作符。最后一个选项是在我们开始特征选择之前自动删除所有恒定特征(如果删除所有列则抛出错误),但这使得这有点隐式,这也不是很好……

    对此有什么看法吗?

  • varunm1varunm1 主持人,职位:1207年独角兽
    对不起@kypexin张贴在这里。@IngoRM你认为下面的帖子也是因为同样的问题吗?我要求用户有一个断点和检查,但它显示有一个功能进入模型,不知道为什么它抛出相同的H2O错误。我尝试了不同的数据集,但没有遇到这个错误。只是好奇为什么当有功能进入GBT时它会返回一个错误

    https://community.www.turtlecreekpls.com/discussion/55910/forward-selection-error-thrown#latest
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    Tghadially
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    是的,接得好!这确实极有可能是出于同样的原因。这个错误信息只有在H2O模型删除了所有的特征时才会显示(这是非常烦人的-希望我们可以关闭这个行为…)。通常情况下,这是因为共线性特征(实际上可以关闭,但不能是其他线程的原因,因为无论如何只有一个输入特征…)。另一个原因是恒定的输入,H2O也会把它去掉。这就是我认为在这里发生的事情:窗口中的所有值都是恒定的,H2O删除它,最后它抱怨没有特征留下(叹气)…
    我会和我们的工程师讨论这个问题,看看他们能不能和H2O的人谈谈,让这个项目成功。但说实话,我不会屏息以待……
    -
    varunm1 Tghadially kypexin
登录注册置评。