如何定义用于聚类方法的距离度量?
所以我目前正在研究不同的聚类方法来分析音乐数据。
那么我该如何设定衡量标准呢?
我正在使用RapidMiner作为一个库,并希望使用例如k-Means方法。我已经初始化了一切,但我仍然在努力定义要使用的距离测量。我希望能够在所有这些RapidMiner提供的数值之间进行选择,但无法找到我必须如何设置它,以及是否有可能获得聚类方法支持的那些度量的列表。
我在类中这样设置操作符及其参数:
Operator clusterer = OperatorService.createOperator(FastKMeans.class);
clusterer运算。setParameter("k", new Integer(k).toString());
…
但是距离测量不是通过参数设置,而是基于给定的示例集(例如FastKMeans.class):
距离测量= this.getInitializedMeasure(eSet);
vs。
int k = this.getParameterAsInt("k");
那么我该如何设定衡量标准呢?
标记:
0
答案
您可以找到有关度量的参数的信息github.
测量是根据给定的数据调整/初始化的,但它们是由参数提供的,正如您在Studio中查看操作员的参数时所看到的那样:
要将度量设置为特定的度量,您必须首先设置度量类型(使用Constant)PARAMETER_MEASURE_TYPES, measure_types),它有可能的值“MixedMeasures”,“nomalmeasures”,“NumericalMeasures”,“bregmandiverences”。
其次,您可以设置要使用的特定度量与相应的参数(其中之一) PARAMETER_ _MEASURE名义数值| |混合或PARAMETER_DIVERGENCE),并将该值设置为上述类中不同类型数组中提供的可能性之一。当然,您可以在这里使用正确的字符串,但我们建议尽可能使用常量。
如果你有更多的问题,请随时提问!
干杯
1月
Paupi