“根据预先定义的字典计算音节”
markus_dressel
成员职位:5贡献我
嗨,社区,
我想数一下文件里的音节。因此,我有一个预定义的字典(excel),其中包含85000个单词及其对应的音节值。
现在我想对文档进行标记,并计算文档中的音节数。因此,我将检索文本中的音节数。我需要什么运算符?
我希望你能在这个话题上帮助我。
先致最诚挚的问候和感谢,
马库斯
标记:
0
最佳答案
-
Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
当然,这其实很简单。首先使用“Process document”对文档进行标记,然后使用“wordlist to Data”操作符输出单词列表,这将为您提供一个包含计数的单词列表示例集。然后,你应该能够使用“join”(你将在单词/标记上连接)来连接你的音节计数,并使用“Generate Attributes”来计算单词计数和每个单词的音节计数的乘积,然后使用“Aggregate”来获得该乘积的总和。而且文档中应该包含所有音节!
1
答案
谢谢,@Telcontar120,得到这个好的解。@markus_dressel你愿意和社区分享你的excel“音节”表吗?它可能是别人觉得有用的资源。
斯科特
这正是我一直在寻找的解决方案。它工作得很完美。非常感谢@Telcontar120
@sgenzer我使用Lougrhan&McDonald提供的商务词典。
列表和全面的解释可以在这里找到在这里:
非常感谢你的帮助,
最好的问候,
马库斯
我昨天刚开始使用RapidMiner,所以我真的是新手,现在有点不知所措。你能不能用屏幕截图给我解释一下最终的解决方案是什么样子的?