我有丢失的数据(40K中的10K),我需要使用自组织地图(SOM)作为聚类方法

asiddiqasiddiq 成员职位:25因素二世
2020年9月编辑 帮助
我有丢失的数据(40K中的10K),我需要使用自组织地图(SOM)作为聚类方法,并且我需要一个初始方法来填充我丢失的数据。
请使用ReapidMiner操作符绘制示例;我会很感激的
标记:

答案

  • jacobcybulskijacobcybulski 委员、大学教授职位:391独角兽
    25%的缺失是很多缺失值,如果你的数据只有很少的属性,我建议放弃所有缺失值的例子,先构建你的集群系统——30K个例子是很多的例子,所以如果你打算使用超过2个维度,可能仍然很难构建一个SOM。然后你可以处理缺失的值,例如通过创建一个imputation模型,并将你的聚类模型只应用于这些例子。
    asiddiq
登录注册置评。