特征选择-前向消除是如何工作的?
Muhammed_Fatih_
成员职位:93Maven
在帮助
你好,
我有一个关于远期淘汰制的选择过程的问题。RapidMiner的文档告诉我们:“Forward Selection操作符从一个空的属性选择开始,在每一轮中,它添加给定ExampleSet的每个未使用的属性。对于每个添加的属性,性能使用内部运算符进行估计,例如交叉验证。只有性能提高最高的属性才会被添加到选择中。然后以修改后的选择开始新一轮。[…]”
这具体意味着什么?假设我的数据集有10个属性,从a1,a2,…a10。向前选择是否依次从a1到a2,然后到a3,直到没有达到性能的增加,或者“只有给予最高性能增加的属性被添加到选择中”是什么意思?
提前感谢您的回复!
最好的问候,
Fatih
我有一个关于远期淘汰制的选择过程的问题。RapidMiner的文档告诉我们:“Forward Selection操作符从一个空的属性选择开始,在每一轮中,它添加给定ExampleSet的每个未使用的属性。对于每个添加的属性,性能使用内部运算符进行估计,例如交叉验证。只有性能提高最高的属性才会被添加到选择中。然后以修改后的选择开始新一轮。[…]”
这具体意味着什么?假设我的数据集有10个属性,从a1,a2,…a10。向前选择是否依次从a1到a2,然后到a3,直到没有达到性能的增加,或者“只有给予最高性能增加的属性被添加到选择中”是什么意思?
提前感谢您的回复!
最好的问候,
Fatih
0
最佳答案
-
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:875独角兽嗨!
在第一轮中,每个属性都被尝试(a1…a10)。RapidMiner选择最好的一个。然后你有一个只有一个属性的模型,这个属性给出了最高的性能。我们假设a6是最好的。
在第二轮中,算法从a6加(a1…A10),因此该模型由两个属性组成:a6和组合性能最佳的属性。也有可能从第一轮开始性能没有提高,所以结果被忽略,只返回单属性模型。
如果第二轮添加了一个属性,那么在第三轮中我们将尝试三属性模型,其中前两个属性将从前几轮中固定下来。等等......
我希望这是清楚的。
这里有一个“投机回合”的设置。这使得在没有性能改进的情况下执行一轮,希望通过执行下一轮选择获得更好的结果。它可能会找到很好的属性组合,但代价是增加了计算时间。
问候,
Balazs6
答案
谢谢你的回答。这帮助了我!关于forward - elimination子进程的另一个问题。为了提高运行时间,您将在交叉验证中使用哪种分类模型?我目前正在进行一个基于矩阵与72.000行和9000个属性的向前消除。我选择SVM作为二部标记的分类器。模型已经运行了2天了。
谢谢你的回答!
Fatih
朴素贝叶斯是最快的算法,特别是在属性数量巨大的情况下。
然而,使用一种算法进行特征选择,然后使用另一种算法进行最终建模并不总是正确的。这种方法对你来说可能很有效,也可能很失败。还是一个值得尝试的好主意。
问候,
Balazs