特征选择-前向消除是如何工作的?

Muhammed_Fatih_ · 2019年11月

你好,

我有一个关于远期淘汰制的选择过程的问题。RapidMiner的文档告诉我们:“Forward Selection操作符从一个空的属性选择开始，在每一轮中，它添加给定ExampleSet的每个未使用的属性。对于每个添加的属性，性能使用内部运算符进行估计，例如交叉验证。只有性能提高最高的属性才会被添加到选择中。然后以修改后的选择开始新一轮。[…]”

这具体意味着什么?假设我的数据集有10个属性，从a1,a2，…a10。向前选择是否依次从a1到a2，然后到a3，直到没有达到性能的增加，或者“只有给予最高性能增加的属性被添加到选择中”是什么意思?

提前感谢您的回复!

最好的问候,

Fatih

BalazsBarany · 2019年11月

嗨！

在第一轮中，每个属性都被尝试(a1…a10)。RapidMiner选择最好的一个。然后你有一个只有一个属性的模型，这个属性给出了最高的性能。我们假设a6是最好的。

在第二轮中，算法从a6加(a1…A10)，因此该模型由两个属性组成:a6和组合性能最佳的属性。也有可能从第一轮开始性能没有提高，所以结果被忽略，只返回单属性模型。

如果第二轮添加了一个属性，那么在第三轮中我们将尝试三属性模型，其中前两个属性将从前几轮中固定下来。等等......

我希望这是清楚的。

这里有一个“投机回合”的设置。这使得在没有性能改进的情况下执行一轮，希望通过执行下一轮选择获得更好的结果。它可能会找到很好的属性组合，但代价是增加了计算时间。

问候,

Balazs

Muhammed_Fatih_ · 2019年11月

嗨,Balazs,

谢谢你的回答。这帮助了我!关于forward - elimination子进程的另一个问题。为了提高运行时间，您将在交叉验证中使用哪种分类模型?我目前正在进行一个基于矩阵与72.000行和9000个属性的向前消除。我选择SVM作为二部标记的分类器。模型已经运行了2天了。

谢谢你的回答!

Fatih

BalazsBarany · 2019年11月

你好,

朴素贝叶斯是最快的算法，特别是在属性数量巨大的情况下。

然而，使用一种算法进行特征选择，然后使用另一种算法进行最终建模并不总是正确的。这种方法对你来说可能很有效，也可能很失败。还是一个值得尝试的好主意。

问候,

Balazs

你好,陌生人!

快速链接

类别

RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

特征选择-前向消除是如何工作的?

最佳答案

答案