聚类精度&如何选择适当数量的聚类
marou_mal96
成员职位:6新手
你好!我有两个关于集群的问题。第一个是关于集群的数量,更具体地说Ι只有数值属性,我不知道k-means聚类的最佳集群是什么。另一个问题是,除了“标签上的地图聚类”之外,是否有任何方法可以执行我的准确性。
提前感谢!
提前感谢!
标记:
0
最好的答案
-
jacobcybulski 委员、大学教授职位:391独角兽你需要做的是做一个实验。使用优化参数(网格)来改变k-means中的集群数量,并记录集群性能度量。在内部,你将需要k-means和一些集群性能,通常是Davis-Bouldin(最接近零是最好的),它可以从集群距离性能中获得,或者从集群分布性能中获得平方和。DB测量工作当你的属性数值和平滑(凸形状),当你收集的日志k vs DB表现情节并找到DB接近零,在理想的情况下顺利稳定的情节,这将是最优k左右。然而,DB经常失败,稳定性试验,在这种情况下,k vs平方和(平均距离集群中心)情节是一个非正式的方法,称为弯头的方法,当您寻找这样的k时,性能增益(最高SOS)与聚类复杂性(k)相比不再显着,它通常看起来像肘尖。1
-
jacobcybulski 委员、大学教授职位:391独角兽
-
jacobcybulski 委员、大学教授职位:391独角兽
-
jacobcybulski 委员、大学教授职位:391独角兽
-
jacobcybulski 委员、大学教授职位:391独角兽
-
jacobcybulski 委员、大学教授职位:391独角兽
-
jacobcybulski 委员、大学教授职位:391独角兽
答案
现在我有这个程序。我可以把PCA放在哪里?
你觉得怎么样?