有没有一种方法可以衡量Word2Vec模型的性能?

Christos_KarapapasChristos_Karapapas 成员职位:25因素二世
2020年1月编辑 帮助
我正在使用word2vec扩展来训练多项式文本分类的模型。
没有一个标准的性能操作符似乎与word2vec模型(RMWord2VecModel)“堆栈”。

有什么方法可以测量模型在训练数据集上的表现吗?
Jasmine_

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
    好问题!通常Word2Vec要么是经验评估(相近的单词应该是“同义词”,意思相近),要么是使用实体识别等下游任务。

    欢呼,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    sgenzer Jasmine_ Christos_Karapapas
  • Christos_KarapapasChristos_Karapapas 成员职位:25因素二世
    所以,如果我理解正确的话,这只是另一种寻找同义词的方法,就像按词根(引理)分组一样?

    如果是这样,为什么要导出一个模型?在以后的处理中使用不同的数据集,仍然能够找到一个词的引理?
    Jasmine_
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    是的,它更像是一个处理模型而不是预测模型。大多数无监督的机器学习方法都不具备与标准预测模型相同的性能度量。

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    Christos_Karapapas Jasmine_
登录注册置评。