“SVM类权重,想不到的结果。”

dragoljubdragoljub 成员职位:241Maven
2019年5月编辑 帮助
嘿,伙计们,

我一直在探索在LibSVM中使用不同的类权值来处理2000(-1)个样本和5000(+1)个样本的二元分类问题。在文献中,似乎将复杂性因素的比例设置为C+1: C-1 =(-1):(+1) = 2:5将导致两类之间的支持向量数量平衡。不幸的是,无论我如何设置我的类权重到支持向量的比例总是不平衡的。理想情况下,尽管训练数据中存在类不平衡,但我希望两个类的支持向量的比例相同。

什么好主意吗?? ?

此外,我注意到“支持向量机”(不是libsvm)算子有一个平衡成本选项,但是模型摘要错误地返回支持向量的数量,即它将每个训练样本计数为支持向量,即使在支持向量表中明显有许多非支持向量。: P

谢谢,
gagi做

答案

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    嗨Gagi做,
    我不太熟悉实现,但它可能是每个支持向量将获得较低的权重?这样计数可能会更大,但权重在各个类别中是相等的。

    问候,
    塞巴斯蒂安。
登录注册置评。