来自数据的处理文档:应用于一组新的数据
最佳答案
-
Telcontar120 版主,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1630年独角兽所以你需要两个都做。如果您在Process Documents中采取了特定的文档处理步骤,那么您将需要将这些步骤同样应用到未来的数据集(例如,标记化、n-grams等),但是您将使用wordlist输入端口,以确保只有在初始模型构建中出现的那些单词被计算在后续的评分中。否则,您可能会从新文档生成新的单词,而模型正在查找的单词将会丢失。0
答案