特征选择:依赖于数据类型的方法

Casper72Casper72 成员职位:17因素二世
亲爱的矿工们:

我试图预测一个大型(80.000 obs.)数据集的二元依赖结果,其中有210个可能的预测因子。在尝试任何逆向消去或甚至是暴力方法之前,我想确定最有用的变量来减少计算时间。变量都是连续的测量,范畴序数和名义。我的知识有限,但我认为根据数据类型使用不同的特征选择方法可能是合适的。

对于每种数据类型(信息增益权重,卡方等),您将使用哪种操作符?或者我应该考虑一种完全不同的特征选择方法?
    登录注册置评。