两种不同数据集上kNN与SVM的比较

dev77cmddev77cmd 成员职位:1新手
5月6日编辑 帮助
你好,

我想导入两个数据集,特别是虹膜(在样本中找到)和葡萄酒数据集(我可以通过读取CSV导入),到这里,葡萄酒数据集的问题是,而不是分别读取每个属性名称,例如:“醇”,“灰”,“酚”等,它将所有属性名称组合在一个名称中。在我的CSV文件中,它们被正确地分开了。

接下来,我想用10倍验证的kNN和SVM模型对它们进行训练,并输出每个模型的Accuracy, Precision, Recall和F-Measure。我所面临的问题是,我使用了“交叉验证”操作符,并在其参数中放置了kNN模型(只是为了测试一个模型),并且在我对性能操作符使用应用模型操作符之后,我只在标准类别中获得了“准确性”和“kappa”。我注意到的是,如果我从样本中使用“泰坦尼克训练”数据集,它会正确输出我上面提到的所有性能标准(精度,召回率等)。为什么呢?此外,我可以使用比较roc操作符来代替交叉验证吗?

在过去的8个小时里,我在youtube视频和Rapidminer教程之间循环,但无济于事。我想做的就是使用葡萄酒和虹膜数据集将kNN分类器与SVM分类器进行比较,并输出Accuracy、Precision、Recall和F-Measure。我是Rapidminer的新手,我真的很想学习如何正确使用它,因为它看起来很精致和简单。
标记:
    登录注册置评。