逻辑回归连续丢失1个多项式属性

弗雷德里克弗雷德里克 成员职位:3.新手
2021年10月编辑 帮助
我有两个多项式数据列,一个是有5个属性的年龄组(例如16- 20,21 -30....),另一个是有4个属性的多项式(关税计划1,2,3,4)。当应用逻辑回归模型时,一个属性没有显示在模型中。例如,每次运行模型时,我都会丢失关税计划2和年龄组31-40。

在交叉验证的ExampleSet中没有数据丢失,但逻辑回归模型没有显示它。





如果我试着把它们从多项式变成数值,我看到了逻辑回归的所有属性,但是没有分析。因为它去掉了共线列。


答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3297年RM数据科学家
    你好,
    该模型使用单热编码删除一列。实际上,只需要class -1列就可以包含所有信息。如果您不希望这样:请使用标称到数字之前的手。

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • 弗雷德里克弗雷德里克 成员职位:3.新手
    我已经尝试使用名义到数字,但正如我上面所说的,逻辑回归模型删除了共线性列(关税计划4和年龄组16=20)。


  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3297年RM数据科学家
    您是否尝试删除“删除共线性”选项?


    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
  • 弗雷德里克弗雷德里克 成员职位:3.新手
    是的,但我希望使用删除的共线列进行分析?对不起,我是一个新手,但它正在删除我的名义到数字栏,如投诉=真实,关税计划= 4,国际计划=否…

    我想使用所有这些被删除的属性进行分析。


登录注册置评。