基于朴素贝叶斯、支持向量机和神经网络的电子邮件分类模型

ejr3ganejr3gan 成员职位:1贡献我
2019年7月编辑 帮助
你好,

我是格洛斯特郡大学的一名学生,我决定扩展今年早些时候我们为我的论文所做的一些电子邮件分类工作。如果我的问题太模糊或我没有提供足够的信息,请原谅我,但我已经阅读了手册和搜索论坛,但无法找到答案。

我试图比较3种分类模型(上面提到的)在分类垃圾邮件和非垃圾邮件时的性能。我有一个电子邮件语料库,已经被分为垃圾邮件和非垃圾邮件(语料库是文本文件的形式,在“黑客的机器学习[O'Reilly, 2012]”一书中用作示例)

我已经设法使我的模型开始,但不断遇到问题。我没有完成很多工作,基本上我已经进入了从文件处理文档的阶段,创建一个向量,通过词干和标记删除一些不需要的数据,然后将单词列表转换为数据,然后写入Excel。这就是我有点卡住的地方,我不确定如何完成模型,甚至我之前所做的是否正确。

我知道这是一个很大的要求,但如果有人愿意带我一步一步地创建一个模型,我将非常感激(我假设一旦我完成了一个模型,其他两个应该非常相似)。

谢谢你的时间。
艾略特

答案

  • MariusHelfMariusHelf RapidMiner认证专家,会员职位:1869年独角兽
    嗨,艾略特,

    你已经看过我们网站上的视频教程了吗?他们很好地解释了如何创建和验证模型,还有专门针对文本处理的视频。如果你结合两个视频系列的知识,你就差不多了:)

    如果你有任何具体的问题,请告诉我们。

    最好的问候,
    马吕斯
  • roohishahidroohishahid 成员职位:2贡献我
    你找到解决办法了吗?
登录注册置评。