回复:交叉距离操作员:奇怪的结果

lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1194年独角兽
2018年12月编辑 产品反馈-已解决

你好,

我使用RapidMiner手动计算了“距离”(而不是......)这次是Excel@sgenzer…)

如果我说错了请制止我,但我考虑过

-对于名义属性:Distance_Attribute_x = IF(Attribute_x[员工特征]== Attribute_x[职位],0,1)。

-对于数值属性:Distance_Attribute_x = (Attribute_x[员工特征]- Attribute_x[职位])^2。

然后Distance = SQRT(sum(Distance_Attribute_x))。

我得到了以下结果:

HR_Sourcing_7.png

为了便于回忆,我用跨越的距离接线员:

HR_Sourcing_8.png

我们看到只有一个“好结果”。

以下是整个过程:

<?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文

<过程扩展= " true " >


.

<列出关键= "注释" >

< / >列表
<列出关键= " data_set_meta_data_information " >
/> .



/> .




< /操作符>




< /操作符>


斯科特的进程 .
< /操作符>


.

<列出关键= "注释" >

< / >列表
<列出关键= " data_set_meta_data_information " >
/> .
/> .






< /操作符>




< /操作符>


.
.

<列出关键= "注释" >

< / >列表
<列出关键= " data_set_meta_data_information " >
/> .
/> .



<列出关键= " key_attributes " / >
< /操作符>

<过程扩展= " true " >

.
< /操作符>

.
< /操作符>

.
< /操作符>

/> .
/> . .


.
.
> < /过程
< /操作符>

<过程扩展= " true " >

<列出关键= " function_descriptions " >
<参数键= " Dist。技能“价值= "如果(技能= = skills_from_ES2, 0,1)”/>
<参数键= " Dist。部门“价值= "如果(部门= = department_from_ES2 0 1)”/>
<参数键= " Dist。语言“价值= "如果(语言= = language_from_ES2, 0,1)”/>
<参数键= " Dist。体验“价值= "战俘((experience-experience_from_ES2), 2)”/>
< / >列表
< /操作符>

<列出关键= " function_descriptions " >

< / >列表
< /操作符>
/> .


.
.
> < /过程
< /操作符>


.
<列出关键= " set_additional_roles " / >
< /操作符>



/> .
< /操作符>


< /操作符>

.

<列出关键= " rename_additional_attributes " >


< / >列表
< /操作符>



<列出关键= " set_additional_roles " / >
< /操作符>

<列出关键= " key_attributes " / >
< /操作符>










/> .
.






/> .
/> . .

.
.

.
> < /过程
< /操作符>
> < /过程

这里是Excel文件:

https://drive.google.com/open?id=1dmj8zlHhtrdzMqVHYYmZO2VuevHCMcFh

我希望我能帮助推进对跨越的距离操作符。

最好的问候,

莱昂内尔

标记:
0
0票

重复的·最后一次更新

评论

  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理

    @lionelderkrikor所以我玩了你的csv文件,我相信这是一个元数据问题(bug)。以下是我的结论:如果你按照这个过程来做,你会得到预期的结果:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >

    <过程扩展= " true " >

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>



    < /操作符>


    < /操作符>
    /> .

    /> .


    .
    .
    .
    > < /过程
    < /操作符>

    .
    < /操作符>

    .

    <列出关键= "注释" >

    < / >列表
    .
    <列出关键= " data_set_meta_data_information " >
    /> .



    /> .


    /> .
    < /操作符>





    < /操作符>


    < /操作符>
    /> . .







    .
    .
    > < /过程
    < /操作符>
    > < /过程

    然而,如果你删除未使用的值(这只会影响元数据),你会遇到和以前一样的问题:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >

    <过程扩展= " true " >

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>



    < /操作符>


    < /操作符>
    /> .

    /> .


    .
    .
    .
    > < /过程
    < /操作符>

    .
    < /操作符>

    .

    <列出关键= "注释" >

    < / >列表
    .
    <列出关键= " data_set_meta_data_information " >
    /> .



    /> .


    /> .
    < /操作符>




    < /操作符>



    < /操作符>
    /> . .





    /> .

    .
    .
    > < /过程
    < /操作符>
    > < /过程

    如果你将“移除未使用的值”移到顶部,这样元数据就会再次匹配,它会再次工作:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 8.1.000”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >

    <过程扩展= " true " >

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>

    <列出关键= " attribute_value " >



    < / >列表
    <列出关键= " set_additional_roles " / >
    < /操作符>



    < /操作符>


    < /操作符>
    /> .

    /> .


    .
    .
    .
    > < /过程
    < /操作符>

    .
    < /操作符>

    .

    <列出关键= "注释" >

    < / >列表
    .
    <列出关键= " data_set_meta_data_information " >
    /> .



    /> .


    /> .
    < /操作符>




    < /操作符>



    < /操作符>
    /> . .



    /> .



    .
    .
    > < /过程
    < /操作符>
    > < /过程

    很奇怪,以前从没见过。我把它移到产品反馈。

    斯科特

  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理

    与其他报告合并交叉距离算子

登录注册置评。