“根据预先定义的字典计算音节”

markus_dresselmarkus_dressel 成员职位:5贡献我
2019年6月编辑 帮助

嗨,社区,

我想数一下文件里的音节。因此,我有一个预定义的字典(excel),其中包含85000个单词及其对应的音节值。

现在我想对文档进行标记,并计算文档中的音节数。因此,我将检索文本中的音节数。我需要什么运算符?

我希望你能在这个话题上帮助我。

先致最诚挚的问候和感谢,

马库斯

最佳答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    解决方案接受

    当然,这其实很简单。首先使用“Process document”对文档进行标记,然后使用“wordlist to Data”操作符输出单词列表,这将为您提供一个包含计数的单词列表示例集。然后,你应该能够使用“join”(你将在单词/标记上连接)来连接你的音节计数,并使用“Generate Attributes”来计算单词计数和每个单词的音节计数的乘积,然后使用“Aggregate”来获得该乘积的总和。而且文档中应该包含所有音节!

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入数据科学咨询由认证的RapidMiner专家
    sgenzer

答案

  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区管理员,成员,大学教授,PM版主职位:2959年社区经理

    谢谢,@Telcontar120,得到这个好的解。@markus_dressel你愿意和社区分享你的excel“音节”表吗?它可能是别人觉得有用的资源。

    斯科特

  • markus_dresselmarkus_dressel 成员职位:5贡献我

    这正是我一直在寻找的解决方案。它工作得很完美。非常感谢@Telcontar120

    @sgenzer我使用Lougrhan&McDonald提供的商务词典。

    列表和全面的解释可以在这里找到在这里

    非常感谢你的帮助,

    最好的问候,

    马库斯

    sgenzer Thomas_Ott
  • TFJ95TFJ95 成员职位:1新手
    谢谢你的帮助@Telcontar120
    我昨天刚开始使用RapidMiner,所以我真的是新手,现在有点不知所措。你能不能用屏幕截图给我解释一下最终的解决方案是什么样子的?


登录注册置评。