在不同的过程中使用训练过的SVM模型
你好,
所以我最终设法进行了情感分析,使用SVM分类算法。
现在我的问题是,我想要分析的数据集非常庞大(>400m tweets)。SVM模型也需要很长时间来训练,因为训练数据库已经有超过10万行。
由于主数据集是在postgresql数据库中,我可能只会查询特定的日子。我希望避免快速miner每次都建立SVM模型。
这怎么可能呢?
提前谢谢你
编辑:也许我可以在这里添加一些问题:
你建议用哪种分类算法?哪个最快,哪个最准确,哪个组合最好?
如何优化整个流程的性能?当我希望分析4亿条推文时,你可以想象我的首要任务是在一个现实的时间框架内完成整个分析,比如最多2-3天的处理时间(在普通笔记本上)。你觉得这有可能吗?
所以我最终设法进行了情感分析,使用SVM分类算法。
现在我的问题是,我想要分析的数据集非常庞大(>400m tweets)。SVM模型也需要很长时间来训练,因为训练数据库已经有超过10万行。
由于主数据集是在postgresql数据库中,我可能只会查询特定的日子。我希望避免快速miner每次都建立SVM模型。
这怎么可能呢?
提前谢谢你
编辑:也许我可以在这里添加一些问题:
你建议用哪种分类算法?哪个最快,哪个最准确,哪个组合最好?
如何优化整个流程的性能?当我希望分析4亿条推文时,你可以想象我的首要任务是在一个现实的时间框架内完成整个分析,比如最多2-3天的处理时间(在普通笔记本上)。你觉得这有可能吗?
标记:
0