“以两个属性为中心?”

韦塞尔韦塞尔 成员职位:537大师
2019年6月编辑 帮助
一个示例数据集:

年,int
性别,名义上:男性,女性
年龄组,标称:0- 20,20 - 40,40 +
死亡率,真正的

如何将此数据集转换为:
一年,
mortality_male_0-20,
mortality_male_20-40,
mortality_male_40 +,
mortality_female_0-20,
mortality_female_20-40,
mortality_female_40 +

我试着:
Example2AttributePivoting
Group_attribute = year
Index_attribute = age_group|性别

但是index_attribute只能有一个属性?


答案

  • 韦塞尔韦塞尔 成员职位:537大师
    编辑:以上帖子已被删除

    是吗?

    聚合丢失信息!
    我想要的变换应该是无损的。
    当您只有一个index_attribute时,attributepivoting工作得很好。
    在Rapidminer中可能有一些方法可以使用两个“index_attributes”。我不知道。

    示例数据集:
    att1:标称:{A, B}
    att2:标称:{T, F}
    Att3:真实的
    Att4:真的

    改变了数据集:
    att3_A_T:实数
    att3_B_T:真实的
    att3_A_F:实数
    att3_B_F:真实的
    att4_A_T:实数
    att4_B_T:真实的
    att4_A_F:真实的
    att4_B_F:真实的
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    嗨韦塞尔,
    解决这个问题有两种可能的方法。我将从比较脏的开始:

    在应用透视之前,您可以使用attributecconstruct操作符创建一个新属性。这个名义属性需要存储属性sex和age_group值的组合。然后,您可以使用这个新属性作为pivot的索引属性。

    第二种方法是要求我们为扩展旋转操作符提供引用。这将一劳永逸地解决这个问题,但成本会更高一些:)

    问候,
    塞巴斯蒂安。
登录注册置评。