k均值聚类后的聚类模型可视化(概述)

offizielleemailoffizielleemail 成员职位:1学我
2018年12月编辑 帮助

嘿,大家,

我是Rapidminer的新手,但我认为它是一个了不起的工具。请原谅我的英语,因为我来自德国。

作为我硕士论文的一部分,我需要证明在某个金融相关数据集中存在聚类。

我是这样设计的:

截图(556). png

得到这些结果:

截图(557). png

在我解释结果之前,我完全没问题。

我想知道为什么xxx平均有三个属性。Xx %小/大]?

如果使用3是标准的方法,那对我来说就很好了。

我可以调整显示属性的数量吗?

也许这对你来说是显而易见的,但请帮助我理解这一点。

谨致问候,

马克斯

标记:

最佳答案

  • yyhuangyyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:363RM数据科学家
    解决方案接受

    @offizielleemail,

    好问题。在AutoModel或modelvisualizer中生成的聚类模型的可视化将从输入数据中给出TOP 3最具影响力的因素。这只是为了简化模型的解释。如果您有150个变量,那么显示所有内容并不优雅;)

    来自autommodel for Clustering的帮助文档:


    结果:聚类
    这是Auto Model的最后一步,在这里您可以检查生成的模型和其他结果。输出取决于数据和您所做的选择。例如,如果停用相关性或k-Means的计算,则不会显示这些结果。
    请注意,结果是在后台计算的。但是,您可以在完成后立即开始检查结果。您可以通过按下底部的停止按钮来停止后台执行。停止执行时未完成的计算将不可用。您可以在执行完成或停止执行后返回并进行更改。
    我们RapidMiner不相信黑盒。这就是为什么您总是可以打开创建模型和所有相关结果的过程。只需单击模型结果并单击屏幕底部的Open Process。这将向您展示执行所有必要的数据预处理和模型优化的过程。您可以使用此流程来部署模型,或者将其作为进一步优化的起点。
    现在我们将在下面详细讨论可能的结果。
    一般
    这一部分显示了独立于模型的一般信息。
    数据:经过转换进行建模后的数据集。
    相关性:显示属性之间相关性的矩阵。
    集群的结果
    结果菜单中的所有其他部分都为集群模型保留。每个集群模型都有自己的部分,通常提供以下条目。
    Summary:显示所有找到的聚类的大小,以及有关聚类及其质量的一些信息。
    热图:标识每个集群最重要的属性。
    集群树:显示描述集群之间主要区别的决策树。
    质心图:显示平行图中聚类质心的值。
    质心表:以表的形式显示集群质心的取值。
    散点图:选择一个簇,根据两个最重要的属性显示散点图。
    Clustered Data:显示一个包含所有数据的表,包括每个数据点的聚类标签。

    HTH,

    YY

    sgenzer

答案

  • MerinMerin 成员职位:8学我
    2021年6月编辑
    @yyhuang
    根据你的信息,我想问一下平均xxx是多少?Xx %更小/更大]的东西。这句话并没有反映属性/集群的质量,对吗?它只是关于什么属性是“微分器”的信息?%是什么意思??谢谢……

    问候,Merin
登录注册置评。