聚类分析
你好,
我根据一个分类法(业务模型:5个维度和5个特征)来描述数据:大约100个具有互斥特征的对象(每个对象正好有5个命中)。所以,我已经用二进制代码(1和0)传输了数据。我已经熟悉k-means聚类方法,但不确定这在这个应用程序中是否正确。我的目标是在数据中找到某些原型(初创公司)并命名它们。
我已经找到了一个类似的工作,但他们使用R进行聚类和聚集自下而上的分层聚类,并使用pvcluster包中的多尺度自举重新采样方法。
在这个应用程序中,您将采用什么方法?我更喜欢两阶段的方法:我将使用Ward的最小方差方法来确定集群的数量,在第二阶段,我进一步需要k-means聚类。
我根据一个分类法(业务模型:5个维度和5个特征)来描述数据:大约100个具有互斥特征的对象(每个对象正好有5个命中)。所以,我已经用二进制代码(1和0)传输了数据。我已经熟悉k-means聚类方法,但不确定这在这个应用程序中是否正确。我的目标是在数据中找到某些原型(初创公司)并命名它们。
我已经找到了一个类似的工作,但他们使用R进行聚类和聚集自下而上的分层聚类,并使用pvcluster包中的多尺度自举重新采样方法。
在这个应用程序中,您将采用什么方法?我更喜欢两阶段的方法:我将使用Ward的最小方差方法来确定集群的数量,在第二阶段,我进一步需要k-means聚类。
标记:
0