单词频率问题

NewbieStudentNewbieStudent 成员职位:2贡献我
嗨,有人知道我怎么计算男性和女性的频率吗?我想创建两个新列,分别是女性和男性,以及每一行的频率。

答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:930独角兽
    嗨!

    这是一个很好的挑战。它可以与分割,去枢轴,分割,聚合和枢轴的组合工作。

    首先,您应该检查导入过程。participant_gender应该是属性名,而不是第一个数据条目。

    你的数据中有其他地方的ID吗?如果没有,你可以使用生成ID来标识行。

    然后使用分裂带有||分隔符。Split使用正则表达式语法,因此该分隔符值将为\|\|。这将创建许多带有单个X::Male或Y::Female条目的附加列。

    然后你可以使用De-Pivot把这些放进去基于ID。您将为每个ID获得多个条目。

    这也可以用分裂分隔符上::。这为您提供了属性中的性别。然后你可以使用按身份和性别分组,数一数。如果需要在新属性上使用这些属性,请使用转换列上的性别值。

    问候,
    Balazs
  • MarcoBarradasMarcoBarradas 管理员,员工,RapidMiner认证分析师,会员职位:267独角兽
    @NewbieStudent

    您可以使用这种方法。

    要了解更多信息,请查看我们的免费文本挖掘课程:https://academy.www.turtlecreekpls.com/learn/course/text-and-web-mining-with-rapidminer/text-and-web-mining/lets-get-started

    <?xml version="1.0" encoding="UTF-8"?><进程版本="9.10.011">      <参数key="logverbosity" value="init"/> <参数key="random_seed" value="-1"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="" "/> <参数key="encoding" value="UTF-8"/>                                                                            


登录注册置评。