“SVM类权重,想不到的结果。”
嘿,伙计们,
我一直在探索在LibSVM中使用不同的类权值来处理2000(-1)个样本和5000(+1)个样本的二元分类问题。在文献中,似乎将复杂性因素的比例设置为C+1: C-1 =(-1):(+1) = 2:5将导致两类之间的支持向量数量平衡。不幸的是,无论我如何设置我的类权重到支持向量的比例总是不平衡的。理想情况下,尽管训练数据中存在类不平衡,但我希望两个类的支持向量的比例相同。
什么好主意吗?? ?
此外,我注意到“支持向量机”(不是libsvm)算子有一个平衡成本选项,但是模型摘要错误地返回支持向量的数量,即它将每个训练样本计数为支持向量,即使在支持向量表中明显有许多非支持向量。: P
谢谢,
gagi做
我一直在探索在LibSVM中使用不同的类权值来处理2000(-1)个样本和5000(+1)个样本的二元分类问题。在文献中,似乎将复杂性因素的比例设置为C+1: C-1 =(-1):(+1) = 2:5将导致两类之间的支持向量数量平衡。不幸的是,无论我如何设置我的类权重到支持向量的比例总是不平衡的。理想情况下,尽管训练数据中存在类不平衡,但我希望两个类的支持向量的比例相同。
什么好主意吗?? ?
此外,我注意到“支持向量机”(不是libsvm)算子有一个平衡成本选项,但是模型摘要错误地返回支持向量的数量,即它将每个训练样本计数为支持向量,即使在支持向量表中明显有许多非支持向量。: P
谢谢,
gagi做
0
答案
我不太熟悉实现,但它可能是每个支持向量将获得较低的权重?这样计数可能会更大,但权重在各个类别中是相等的。
问候,
塞巴斯蒂安。