特征选择-前向消除是如何工作的?

Muhammed_Fatih_Muhammed_Fatih_ 成员职位:93Maven
你好,

我有一个关于远期淘汰制的选择过程的问题。RapidMiner的文档告诉我们:“Forward Selection操作符从一个空的属性选择开始,在每一轮中,它添加给定ExampleSet的每个未使用的属性。对于每个添加的属性,性能使用内部运算符进行估计,例如交叉验证。只有性能提高最高的属性才会被添加到选择中。然后以修改后的选择开始新一轮。[…]”

这具体意味着什么?假设我的数据集有10个属性,从a1,a2,…a10。向前选择是否依次从a1到a2,然后到a3,直到没有达到性能的增加,或者“只有给予最高性能增加的属性被添加到选择中”是什么意思?

提前感谢您的回复!

最好的问候,

Fatih

最佳答案

答案

  • Muhammed_Fatih_Muhammed_Fatih_ 成员职位:93Maven
    嗨,Balazs,

    谢谢你的回答。这帮助了我!关于forward - elimination子进程的另一个问题。为了提高运行时间,您将在交叉验证中使用哪种分类模型?我目前正在进行一个基于矩阵与72.000行和9000个属性的向前消除。我选择SVM作为二部标记的分类器。模型已经运行了2天了。

    谢谢你的回答!

    Fatih
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:875独角兽
    你好,

    朴素贝叶斯是最快的算法,特别是在属性数量巨大的情况下。

    然而,使用一种算法进行特征选择,然后使用另一种算法进行最终建模并不总是正确的。这种方法对你来说可能很有效,也可能很失败。还是一个值得尝试的好主意。

    问候,

    Balazs
    Muhammed_Fatih_ varunm1 sgenzer
登录注册置评。