H20变量重要性

User36964User36964 委员、大学教授职位:15大学教授
H20深度学习模型提供了“计算变量重要性”的选择。
如果被选中,深度学习模型的输出将列出十大重要属性。是否有办法将这个数字增加到前20名或前100名?

答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    2019年4月编辑
    你好@User36964

    我确信H2O正在计算数据集中所有变量的变量重要性,我认为它的快速挖掘视图限制了你看到所有变量。我可以看到最重要的10个变量和最不重要的10个变量及其重要性。我看不出有任何扩展的选项

    @hughesfleming68对此有什么建议吗?

    谢谢
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    User36964
  • User36964User36964 委员、大学教授职位:15大学教授
    我想知道他们为什么要限制它。任何人使用这个扩展需要看到所有变量的重要性。
    aileenzhou
  • varunm1varunm1 主持人,职位:1207年独角兽
    2019年4月编辑
    我理解你的担忧@User36964,但在某些情况下,如果属性非常高(100),则很难查看所有属性。应该有一个提取变量重要性的选项。

    您可以使用解释预测操作符查看哪些变量影响了您的模型预测。与可变重要性相比,我会经常使用这个。一个原因是H2O变量重要性方法(基于Gedeon的)的局限性,它只根据权重从网络的前两层提取重要性,但对于大型网络来说,它并不好,因为更深的网络会影响你的变量重要性。

    凡事都有其局限性微笑:
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    User36964 IngoRM hughesfleming68
  • User36964User36964 委员、大学教授职位:15大学教授
    2019年4月编辑
    正如你所说,应该有一个导入所有重要信息的选项。

    解释预测操作符解释每一行数据的预测。因此,收集重要属性的一般(总体)概念有点挑战性。可以手动计算每个预测的属性频率,以找到最有效的支持和矛盾属性。


  • varunm1varunm1 主持人,职位:1207年独角兽
    实际上,我使用解释预测算子做了一些额外的分析。另外一些解释预测的操作符将为我提供支持和反驳正确预测以及错误预测的属性。如果您感兴趣,可以查看下面的线程,了解基于结果(正确或不正确)提取属性的过程。

    我正在尝试研究一些基于这个算子的特征选择技术,如果@IngoRM如果它更早,它将在RM中可用。

    https://community.www.turtlecreekpls.com/discussion/55351/explain-predictions-ranking-attributes-that-supports-and-contradicts-correct-predictions#latest

    谢谢
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    User36964
  • User36964User36964 委员、大学教授职位:15大学教授
    谢谢,
    我期待看到你的解决方案
登录注册置评。