回复:交叉距离操作员:奇怪的结果
lionelderkrikor
主持人,RapidMiner认证分析师,会员职位:1194年独角兽
你好,
我使用RapidMiner手动计算了“距离”(而不是......)这次是Excel@sgenzer…)
如果我说错了请制止我,但我考虑过
-对于名义属性:Distance_Attribute_x = IF(Attribute_x[员工特征]== Attribute_x[职位],0,1)。
-对于数值属性:Distance_Attribute_x = (Attribute_x[员工特征]- Attribute_x[职位])^2。
然后Distance = SQRT(sum(Distance_Attribute_x))。
我得到了以下结果:
为了便于回忆,我用跨越的距离接线员:
我们看到只有一个“好结果”。
以下是整个过程:
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >.
<列出关键= "注释" >
< / >列表
<列出关键= " data_set_meta_data_information " >
/> .
/> .
< /操作符>
< /操作符>斯科特的进程 .
< /操作符>.
<列出关键= "注释" >
< / >列表
<列出关键= " data_set_meta_data_information " >
/> .
/> .
< /操作符>
< /操作符>. .
<列出关键= "注释" >
< / >列表
<列出关键= " data_set_meta_data_information " >
/> .
/> .
<列出关键= " key_attributes " / >
< /操作符>
<过程扩展= " true " >.
< /操作符>.
< /操作符>.
< /操作符>
/> .
/> .. . .
> < /过程
< /操作符>
<过程扩展= " true " >
<列出关键= " function_descriptions " >
<参数键= " Dist。技能“价值= "如果(技能= = skills_from_ES2, 0,1)”/>
<参数键= " Dist。部门“价值= "如果(部门= = department_from_ES2 0 1)”/>
<参数键= " Dist。语言“价值= "如果(语言= = language_from_ES2, 0,1)”/>
<参数键= " Dist。体验“价值= "战俘((experience-experience_from_ES2), 2)”/>
< / >列表
< /操作符>
<列出关键= " function_descriptions " >
< / >列表
< /操作符>
/> .. .
> < /过程
< /操作符>.
<列出关键= " set_additional_roles " / >
< /操作符>
/> .
< /操作符>
< /操作符>.
<列出关键= " rename_additional_attributes " >
< / >列表
< /操作符>
<列出关键= " set_additional_roles " / >
< /操作符>
<列出关键= " key_attributes " / >
< /操作符>
/> ..
/> .
/> .. . . .
> < /过程
< /操作符>
> < /过程
这里是Excel文件:
https://drive.google.com/open?id=1dmj8zlHhtrdzMqVHYYmZO2VuevHCMcFh
我希望我能帮助推进对跨越的距离操作符。
最好的问候,
莱昂内尔
0
评论
嗨@lionelderkrikor所以我玩了你的csv文件,我相信这是一个元数据问题(bug)。以下是我的结论:如果你按照这个过程来做,你会得到预期的结果:
然而,如果你删除未使用的值(这只会影响元数据),你会遇到和以前一样的问题:
如果你将“移除未使用的值”移到顶部,这样元数据就会再次匹配,它会再次工作:
很奇怪,以前从没见过。我把它移到产品反馈。
斯科特
与其他报告合并交叉距离算子