随机森林回归的特征权重中发现的问题
marcin_blachnik
成员职位:61大师
RandomForest操作符返回的feature_weights似乎有问题或bug,但仅用于回归。我在一个数据集上发现了这个问题,但我在IRIS数据集上重建了它,其中a3和a4的特征是最重要的,但根据回归随机森林,这两个特征是最不重要的。
我评估了RandomForest回归的其他实现,这些实现返回正确的权重(预期的权重)。
致以最亲切的问候
戈
我评估了RandomForest回归的其他实现,这些实现返回正确的权重(预期的权重)。
致以最亲切的问候
戈
0
答案
Lindon合资企业
乐鱼平台进入数据科学咨询由认证的RapidMiner专家
下面我附上另一个进程,可以看到,根据RandomForest的RapidMiner实现,带有纯噪声的属性是第二重要的变量(最重要的似乎也是随机选择的属性)。因为树很简单(5棵深度为5的树),所以可以计算每个属性作为决策节点出现的次数。噪声变量是最不重要的。
~马丁
德国多特蒙德