登录
注册
乐鱼官网手机版下载
解决方案
乐鱼体育安装
定价
合作伙伴
公司
你好,陌生人!
看起来你是新来的。登录或注册开始。
使用RapidMiner登录
使用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.1 k
所有类别
19.1 k
帮助
442
知识库
RapidMiner社区
得到帮助。学习最佳实践。与你的同事建立联系。
讨论
将训练好的模型应用于新的未标记数据集时出错
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:周一,今天,上周,3月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问一个问题
寻找有用的视频
首页
;
帮助
将训练好的模型应用于新的未标记数据集时出错
Stann
成员
职位:
5
学我
2021年5月
在
帮助
我想把朴素贝叶斯模型应用到一个新的(未标记的)数据集上。该模型已经通过交叉验证进行了训练和测试。然而,当我试图将模型应用于一个全新的数据集时,我得到一个错误消息。
以下是我的流程概述和我得到的错误:
“检索聚合”是新的(未标记的)数据集,我想使用我训练过的模型来预测它。
“从数据处理文档”包含一个“Tokenize”操作符。
交叉验证操作符中的子流程有:
我是RapidMiner的新手,我不知道为什么我得到这个错误
我将非常感谢你的帮助,因为我需要继续我的研究
标记:
分类
应用模型
朴素贝叶斯
0
最佳答案
lionelderkrikor
主持人,RapidMiner认证分析师,会员
职位:
1194年
独角兽
2021年5月
解决方案接受
@Stann
,
是的,这是可能的:
如前所述,在测试集“分支”中应用相同的预处理步骤。
并连接单词输出(
磨破
)
从数据中处理文档
操作员将您的训练“分支”字输入(
磨破
)。
从数据中处理文档
你的测试集分支。
问候,
莱昂内尔
1
答案
lionelderkrikor
主持人,RapidMiner认证分析师,会员
职位:
1194年
独角兽
2021年5月
嗨
@Stann
,
训练集和未标记的测试集的属性必须完全相同。
因此,您必须对未标记的测试集严格应用相同的预处理步骤(因此,您必须应用
标称文本
和
从数据中生成文档
操作员到您的测试集)。目前,您正在将原始测试集应用于模型…
希望这能帮到你,
问候,
莱昂内尔
0
ceaperez
成员
职位:
352
独角兽
2021年5月
嗨
@Stann
,
似乎你的训练数据集和测试数据集的属性(列)的名称不一样。
请验证测试数据集的名称和类型。
最好的
1
Stann
成员
职位:
5
学我
2021年5月
@lionelderkrikor
,
@ceaperez
感谢您的快速回复。
拥有完全相同的属性是不可能的,因为每个属性都是出现在初始文本文档中的标记(单词)。由于新的(未标记的)数据集包含不同的文本文档作为训练集,因此属性总是不同的,因为新数据集中的文本文档由“新”标记组成。
话虽如此,是否还有一种方法可以将模型应用于新的(未标记的)集合?
0
登录
或
注册
置评。
答案
训练集和未标记的测试集的属性必须完全相同。
因此,您必须对未标记的测试集严格应用相同的预处理步骤(因此,您必须应用
标称文本和从数据中生成文档操作员到您的测试集)。目前,您正在将原始测试集应用于模型…
希望这能帮到你,
问候,
莱昂内尔
拥有完全相同的属性是不可能的,因为每个属性都是出现在初始文本文档中的标记(单词)。由于新的(未标记的)数据集包含不同的文本文档作为训练集,因此属性总是不同的,因为新数据集中的文本文档由“新”标记组成。
话虽如此,是否还有一种方法可以将模型应用于新的(未标记的)集合?