评估聚类算法?

Mm861552Mm861552 成员职位:1新手
我们正在为数据科学项目研究文本聚类,我们找到了一些可以处理文本的算法乐鱼平台进入
-K-means
-K-medoids
这两个都是质心聚类,我们使用Davies Bouldin评价指标对它们进行评价
烧结的集群
自顶向下集群
这两种都是分层聚类,但我们不知道如何对它们进行评价,我们需要对这四种进行比较,所以我们需要找到统一的评价方法

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1630年独角兽
    由于聚类通常是一个无监督的ML问题,因此很难找到可用于比较不同算法(例如您列出的那些算法)的指标。你到底想比较什么结果?您可以使用诸如“集群数量”或“每个集群的记录数量”之类的琐碎指标,但这并不一定能告诉您很多信息。如果你的数据集有一个性能变量(RapidMiner术语中的“标签”),那么你可以尝试使用有用的“在标签上映射集群”操作符,然后查看其他更常见的监督ML问题的指标,但你需要确保与标签相比,你有正确的集群数量。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
登录注册置评。