如何定义用于聚类方法的距离度量?

DiePaupiDiePaupi 成员职位:3.贡献我
所以我目前正在研究不同的聚类方法来分析音乐数据。
我正在使用RapidMiner作为一个库,并希望使用例如k-Means方法。我已经初始化了一切,但我仍然在努力定义要使用的距离测量。我希望能够在所有这些RapidMiner提供的数值之间进行选择,但无法找到我必须如何设置它,以及是否有可能获得聚类方法支持的那些度量的列表。

我在类中这样设置操作符及其参数:
Operator clusterer = OperatorService.createOperator(FastKMeans.class);
clusterer运算。setParameter("k", new Integer(k).toString());


但是距离测量不是通过参数设置,而是基于给定的示例集(例如FastKMeans.class):
距离测量= this.getInitializedMeasure(eSet);

vs。

int k = this.getParameterAsInt("k");

那么我该如何设定衡量标准呢?
标记:

最佳答案

  • jczogallajczogalla 员工,成员职位:144RM工程
    解决方案接受
    @DiePaupi

    您应该能够在所有集群操作符中找到这些参数。他们应该在打电话的时候出现
    getParameterTypes ()
    在代码中,你可以看到它们是由这一行添加的:
    类型< span > .addAll (getMeasureParameterTypes ()); < / span >
    所以设置这些参数应该和设置参数一样容易k就像你已经在做的那样。

    干杯
    1月
    DiePaupi

答案

  • jczogallajczogalla 员工,成员职位:144RM工程
    @DiePaupi

    您可以找到有关度量的参数的信息github
    测量是根据给定的数据调整/初始化的,但它们是由参数提供的,正如您在Studio中查看操作员的参数时所看到的那样:


    要将度量设置为特定的度量,您必须首先设置度量类型(使用Constant)PARAMETER_MEASURE_TYPES, measure_types),它有可能的值“MixedMeasures”,“nomalmeasures”,“NumericalMeasures”,“bregmandiverences”。
    其次,您可以设置要使用的特定度量与相应的参数(其中之一) PARAMETER_ _MEASURE名义数值| |混合PARAMETER_DIVERGENCE),并将该值设置为上述类中不同类型数组中提供的可能性之一。当然,您可以在这里使用正确的字符串,但我们建议尽可能使用常量。

    如果你有更多的问题,请随时提问!

    干杯
    1月
  • DiePaupiDiePaupi 成员职位:3.贡献我
    @jczogalla,谢谢你的快速回复!

    我应该在哪里设置这些参数?我在聚类方法/操作符类中找不到它们。

    谢谢你的帮助!
  • DiePaupiDiePaupi 成员职位:3.贡献我
    @jczogalla

    谢谢你的帮助!它现在工作得很好,为了记录,我使用的具体行如下:
    clusterer.setParameter (DistanceMeasures。PARAMETER_MEASURE_TYPES, DistanceMeasures.MEASURE_TYPES[DistanceMeasures.NUMERICAL_MEASURES_TYPE]);
    clusterer.setParameter (DistanceMeasures。PARAMETER_NUMERICAL_MEASURE measureType);
    其中“measureType”是一个字符串,包含要使用的距离测量的名称,在distancemmeasure .class中指定:
    NUMERICAL_MEASURES = new String[]{"EuclideanDistance", "CamberraDistance", "ChebychevDistance",
    "CorrelationSimilarity", " cosinessimilarity ", " dicessimilarity ", "DynamicTimeWarpingDistance",
    "Inner乐鱼官网手机版下载ProductSimilarity", "JaccardSimilarity", "KernelEuclideanDistance", "ManhattanDistance",
    “Max乐鱼官网手机版下载ProductSimilarity”、“OverlapSimilarity "};

    干杯
    Paupi
    jczogalla
登录注册置评。