簇大小与质心表有什么关系?哪个模型更有意义?为什么?

NatalySimthNatalySimth 成员职位:8因素二世
你好各位,

我正在比较两个结果,我有他们如下:

我的问题是:簇大小和质心表有什么关系?哪个模型更有意义?为什么?
(Case1):



(例2):

标记:
Tghadially Jasmine_

最佳答案

答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1193年独角兽
    2019年10月编辑
    @NatalySimth

    在没有任何附加信息的情况下,要有一个大致的概念,你可以计算在质心距离内平均它衡量集群的“容量”。(比较两个模型)。
    为此,你必须加一个性能(集群距离性能)操作符。

    编辑:
    我想更正/完成上面的解释:
    假设您使用的是k -means算法,这是一种寻找最佳k(簇数(s))的方法,因此是最佳模型,根据“k”绘制“质心距离内的平均值”。你会得到这样的曲线(或在相反的方向,因为在RapidMiner质心距离内的平均值是负的):



    最好的k,也就是更相关的模型与曲线的拐点相匹配。

    希望这有助于


    问候,

    莱昂内尔
    sgenzer varunm1 Jasmine_
  • NatalySimthNatalySimth 成员职位:8因素二世
    lionelderkrikor谢谢你的解释。如果你允许我问,集群的“容量”是什么意思?

    我怎样才能创造业绩和手肘?对所有这些方法来说仍然是新的。
    Jasmine_
  • NatalySimthNatalySimth 成员职位:8因素二世
    @lionelderkrikor由于一百万年!:)如此有用的信息。
    lionelderkrikor varunm1 Jasmine_
  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1193年独角兽
    @NatalySimth

    欢迎你!

    问候,

    莱昂内尔
    NatalySimth Jasmine_
  • Muhammed_Fatih_Muhammed_Fatih_ 成员职位:93Maven
    @lionelderkrikor

    感谢你从上面给出的鼓舞人心的答案!从这个意义上说,应该也可以通过使用davis - bouldin指数来生成Ellbow来比较主要标准,对吗?

    提前感谢你的回答!

    的问候!
    Jasmine_
  • tonyboy9tonyboy9 成员职位:101因素二世
    更好的做法是,将davis - bouldin索引返回到k-means的AutoModel结果。有人知道为什么这个结果被删除了吗?我的意思是,解释k-means结果已经是一个挑战。
  • prashant768prashant768 成员职位:4学我
    lionelderkrikor谢谢你的解释。

    但是你能让我知道你是如何在rapidminer中得到惯性图的,因为它中的选项只有在质心和DB内的avg。

    我想根据惯性准则画出它。请帮助
登录注册置评。