可视化文本分类模型

nennatnennat 成员职位:9因素二世
2019年6月编辑 帮助
你好,

我有个小问题。对于文本分类,我尝试了不同的建模技术(Naïve贝叶斯,libSVM和K-NN)。性能不是很好,但我认为这是由于数据质量和不同类别的重叠(这可能是决策树不起作用的原因)。

然而,为了报告这一点,我想通过展示哪些单词/元素在决定将文本分配到特定类别时对模型产生重大影响来可视化这一点。也许我解释得很糟糕(这可能就是为什么我还没有找到关于这个话题的任何东西的原因)。但我的问题用外行的话来说就是:我如何才能看出哪些词“触发”了某个类别?

非常感谢您的帮助!

答案

  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    你好,

    对于k-NN来说,很难解释模型。对于朴素贝叶斯,您可以将其模型输出端口连接到过程输出并研究模型。线性(!!)SVM提供了一个可很好解释的权重向量,您可以通过查看模型或将权重输出连接到过程输出来检查该权重向量。

    最好的问候,
    马吕斯
登录注册置评。