单词频率问题

NewbieStudent · 2022年11月

嗨，有人知道我怎么计算男性和女性的频率吗?我想创建两个新列，分别是女性和男性，以及每一行的频率。

Image: https://us.v-cdn.net/6030995/uploads/editor/9u/wutdvt8uci0y.png

我

BalazsBarany · 2022年11月

嗨！

这是一个很好的挑战。它可以与分割，去枢轴，分割，聚合和枢轴的组合工作。

首先，您应该检查导入过程。participant_gender应该是属性名，而不是第一个数据条目。

你的数据中有其他地方的ID吗?如果没有，你可以使用生成ID来标识行。

然后使用分裂带有||分隔符。Split使用正则表达式语法，因此该分隔符值将为\|\|。这将创建许多带有单个X::Male或Y::Female条目的附加列。

然后你可以使用De-Pivot把这些放进去列到行基于ID。您将为每个ID获得多个条目。

这也可以用分裂分隔符上::。这为您提供了属性中的性别。然后你可以使用总按身份和性别分组，数一数。如果需要在新属性上使用这些属性，请使用主转换列上的性别值。

问候,
Balazs

MarcoBarradas · 2022年11月

嘿@NewbieStudent

您可以使用这种方法。

要了解更多信息，请查看我们的免费文本挖掘课程:https://academy.www.turtlecreekpls.com/learn/course/text-and-web-mining-with-rapidminer/text-and-web-mining/lets-get-started

<？xml version="1.0" encoding="UTF-8"?><进程版本="9.10.011">      <参数key="logverbosity" value="init"/> <参数key="random_seed" value="-1"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="" "/> <参数key="encoding" value="UTF-8"/>

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

单词频率问题

答案