单词频率问题
NewbieStudent
成员职位:2贡献我
在帮助
嗨,有人知道我怎么计算男性和女性的频率吗?我想创建两个新列,分别是女性和男性,以及每一行的频率。
我
我
0
0评论 | 0的讨论 | 0成员 | 0在线 |
答案
这是一个很好的挑战。它可以与分割,去枢轴,分割,聚合和枢轴的组合工作。
首先,您应该检查导入过程。participant_gender应该是属性名,而不是第一个数据条目。
你的数据中有其他地方的ID吗?如果没有,你可以使用生成ID来标识行。
然后使用分裂带有||分隔符。Split使用正则表达式语法,因此该分隔符值将为\|\|。这将创建许多带有单个X::Male或Y::Female条目的附加列。
然后你可以使用De-Pivot把这些放进去列到行基于ID。您将为每个ID获得多个条目。
这也可以用分裂分隔符上::。这为您提供了属性中的性别。然后你可以使用总按身份和性别分组,数一数。如果需要在新属性上使用这些属性,请使用主转换列上的性别值。
问候,
Balazs
您可以使用这种方法。
要了解更多信息,请查看我们的免费文本挖掘课程:https://academy.www.turtlecreekpls.com/learn/course/text-and-web-mining-with-rapidminer/text-and-web-mining/lets-get-started