De-pivot吗?

earmijoearmijo 成员职位:265独角兽
2018年11月编辑 帮助

想象一下,我有一个示例集(在使用集群之后),看起来像这样:

id、集群、product1 product2
1, clust0, 10.5, 20.3
2, clust1, 15.75, 30.12
3, clust0, 5.25, 27.2
4, clust1, 12.75, 8.25
5, clust0, 18.05, 22.3
6, clust1, 1.25, 3.75

我需要它的格式如下:

id、集群、价值类型
1、clust0 10.5, product1
2 clust1 15.75, product1
3 clust0 5.25, product1
4、clust1 12.75, product1
5、clust0 18.05, product1
6 clust1 1.25, product1
1、clust0 20.3, product2
2 clust1 30.12, product2
3 clust0 27.2, product2
4、clust1 8.25, product2
5、clust0 22.3, product2
6 clust1 3.75, product2

我怎么能做到呢?如果我没有id集群我可以很容易地用去支点。但我不知道在其他两个属性存在的情况下如何做。

最佳答案

  • yyhuangyyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:363RM数据科学家
    解决方案接受

    @earmijo

    您不必删除id或cluster列来取消表的pivot,

    看看这个过程:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.3.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    < /操作符>



    <列出关键= "注释" / >
    <列出关键= " data_set_meta_data_information " / >
    < /操作符>

    <列出关键= " attribute_name " >

    < / >列表


    < /操作符>







    > < /过程
    < /操作符>
    > < /过程

    RapidMining快乐!

    YY

    Thomas_Ott

答案

  • 安德鲁安德鲁 RapidMiner认证专家,RapidMiner认证大师,会员职位:47大师

    为了好玩,我做了一个你想要的过程,但不使用去支点。它使用Loop Attributes操作符遍历要选择的每个常规属性,这允许创建一个包含单个常规属性和所有其他特殊属性的示例集。然后进行一些重命名和生成,以便循环操作的输出是一个集合,可以将其附加在一起以产生答案。

    安德鲁

    depivot.rmp 10.5K
    Thomas_Ott
  • earmijoearmijo 成员职位:265独角兽

    非常感谢Andrew花时间来解决我的问题。效果很好。

  • earmijoearmijo 成员职位:265独角兽

    非常感谢Andrew。效果很好。

  • earmijoearmijo 成员职位:265独角兽

    非常感谢,yyhuang。在本例中,它可以完美地工作。

    当列的名称不再是“product1, product2, product 3…”,而是“supermarket,gasoline,hotels, ....”时,我该如何概括它?在第一种情况下,我可以用(像你那样)“产品。*”。我尽力了。”在我的情况下,它不起作用。

  • yyhuangyyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:363RM数据科学家

    非常好的问题@earmijo!实际上,对于不容易用正则表达式选择的列,您仍然可以使用去枢轴。表连接只需要额外的步骤。

    看看这个:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.3.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    < /操作符>



    <列出关键= "注释" / >
    <列出关键= " data_set_meta_data_information " / >
    < /操作符>






    < /操作符>




    < /操作符>

    <列出关键= " attribute_name " >

    < / >列表


    < /操作符>



    <列出关键= " key_attributes " >

    < / >列表
    < /操作符>












    > < /过程
    < /操作符>
    > < /过程
    Thomas_Ott
登录注册置评。