“以两个属性为中心?”
一个示例数据集:
年,int
性别,名义上:男性,女性
年龄组,标称:0- 20,20 - 40,40 +
死亡率,真正的
如何将此数据集转换为:
一年,
mortality_male_0-20,
mortality_male_20-40,
mortality_male_40 +,
mortality_female_0-20,
mortality_female_20-40,
mortality_female_40 +
我试着:
Example2AttributePivoting
Group_attribute = year
Index_attribute = age_group|性别
但是index_attribute只能有一个属性?
年,int
性别,名义上:男性,女性
年龄组,标称:0- 20,20 - 40,40 +
死亡率,真正的
如何将此数据集转换为:
一年,
mortality_male_0-20,
mortality_male_20-40,
mortality_male_40 +,
mortality_female_0-20,
mortality_female_20-40,
mortality_female_40 +
我试着:
Example2AttributePivoting
Group_attribute = year
Index_attribute = age_group|性别
但是index_attribute只能有一个属性?
标记:
0
答案
是吗?
聚合丢失信息!
我想要的变换应该是无损的。
当您只有一个index_attribute时,attributepivoting工作得很好。
在Rapidminer中可能有一些方法可以使用两个“index_attributes”。我不知道。
示例数据集:
att1:标称:{A, B}
att2:标称:{T, F}
Att3:真实的
Att4:真的
改变了数据集:
att3_A_T:实数
att3_B_T:真实的
att3_A_F:实数
att3_B_F:真实的
att4_A_T:实数
att4_B_T:真实的
att4_A_F:真实的
att4_B_F:真实的
解决这个问题有两种可能的方法。我将从比较脏的开始:
在应用透视之前,您可以使用attributecconstruct操作符创建一个新属性。这个名义属性需要存储属性sex和age_group值的组合。然后,您可以使用这个新属性作为pivot的索引属性。
第二种方法是要求我们为扩展旋转操作符提供引用。这将一劳永逸地解决这个问题,但成本会更高一些
问候,
塞巴斯蒂安。