k均值聚类后的聚类模型可视化(概述)
offizielleemail
成员职位:1学我
嘿,大家,
我是Rapidminer的新手,但我认为它是一个了不起的工具。请原谅我的英语,因为我来自德国。
作为我硕士论文的一部分,我需要证明在某个金融相关数据集中存在聚类。
我是这样设计的:
得到这些结果:
在我解释结果之前,我完全没问题。
我想知道为什么xxx平均有三个属性。Xx %小/大]?
如果使用3是标准的方法,那对我来说就很好了。
我可以调整显示属性的数量吗?
也许这对你来说是显而易见的,但请帮助我理解这一点。
谨致问候,
马克斯
标记:
0
最佳答案
-
yyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:363RM数据科学家
好问题。在AutoModel或modelvisualizer中生成的聚类模型的可视化将从输入数据中给出TOP 3最具影响力的因素。这只是为了简化模型的解释。如果您有150个变量,那么显示所有内容并不优雅
来自autommodel for Clustering的帮助文档:
结果:聚类
这是Auto Model的最后一步,在这里您可以检查生成的模型和其他结果。输出取决于数据和您所做的选择。例如,如果停用相关性或k-Means的计算,则不会显示这些结果。
请注意,结果是在后台计算的。但是,您可以在完成后立即开始检查结果。您可以通过按下底部的停止按钮来停止后台执行。停止执行时未完成的计算将不可用。您可以在执行完成或停止执行后返回并进行更改。
我们RapidMiner不相信黑盒。这就是为什么您总是可以打开创建模型和所有相关结果的过程。只需单击模型结果并单击屏幕底部的Open Process。这将向您展示执行所有必要的数据预处理和模型优化的过程。您可以使用此流程来部署模型,或者将其作为进一步优化的起点。
现在我们将在下面详细讨论可能的结果。
一般
这一部分显示了独立于模型的一般信息。
数据:经过转换进行建模后的数据集。
相关性:显示属性之间相关性的矩阵。
集群的结果
结果菜单中的所有其他部分都为集群模型保留。每个集群模型都有自己的部分,通常提供以下条目。
Summary:显示所有找到的聚类的大小,以及有关聚类及其质量的一些信息。
热图:标识每个集群最重要的属性。
集群树:显示描述集群之间主要区别的决策树。
质心图:显示平行图中聚类质心的值。
质心表:以表的形式显示集群质心的取值。
散点图:选择一个簇,根据两个最重要的属性显示散点图。
Clustered Data:显示一个包含所有数据的表,包括每个数据点的聚类标签。HTH,
YY
1
答案
根据你的信息,我想问一下平均xxx是多少?Xx %更小/更大]的东西。这句话并没有反映属性/集群的质量,对吗?它只是关于什么属性是“微分器”的信息?%是什么意思??谢谢……
问候,Merin