基于难度的英语冠词分类

alaa_albarazialaa_albarazi 成员职位:1学我
2018年12月编辑 帮助

嗨,《欧洲共同语言参考框架》将语言难度分为A、B、C三个主要级别组,每个级别组有两个子级别。级别是(A1初级,A2初级.....C2掌握)。

我有成千上万的文档,我需要根据使用RabidMiner或Python的难度级别进行分组。其中一个概念是使用一份包含最常用口语单词的文档,看看一篇文章中的单词与最常见的1000个单词有多接近。但是这种方法忽略了语法上的困难。除了单词难度,我还需要为每篇文章添加词性标签,每个句子的长度,然后找到一种方法来考虑文章的容易或困难。如果有现成的库可以做到这一点,那就太好了。

在这方面有什么方案可以提供帮助?你有什么建议吗?

标记:

答案

登录注册置评。