如何获得性能的测试数据,其中标签没有值

User111113User111113 成员职位:24Maven
你好,

我试着找出我的模型在训练数据上的表现,我成功地做到了



现在我想看看它在测试数据上的表现,所以我添加了另一个应用模型和性能,当然我的测试数据如下所示


这可能是因为我的“标签参数”在“测试数据”中是空白的,因为我想看看它将预测什么值.......我能够得到预测的结果,但要看到我的模型如何在标签....中没有值的全新数据集上执行如果可以,我们怎么做?
squared_error:未知

root_mean_squared_error:未知

如果我试图将“设置角色”放在“应用模型”和“性能”之间,我可以将预测的变量设置为我的“标签”,这是不对的,因为预测的变量列不存在于原始测试数据中,因此不起作用


Jasmine_

最佳答案

  • User111113User111113 成员职位:24Maven
    解决方案接受
    是的。11月19日的数据不在训练集中,但我觉得我可以运行多少个模型的选择非常有限。我只看到3个模型,主要是2个GBT和随机森林来处理我的数据,因为它只有一个真实/int变量,即响应率,而所有其他变量都是多项式。
    varunm1 Jasmine_

答案

  • varunm1varunm1 主持人,职位:1207年独角兽
    看看我的模型如何在标签....中没有值的全新数据集上执行如果可以,我们怎么做?
    不,没有原始已知标签就无法计算常规性能指标。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    sgenzer Jasmine_
  • User111113User111113 成员职位:24Maven
    @varunm1

    谢谢你的回复。

    我的下一步是在没有性能的情况下运行它,并将结果保存在excel文件中,然后我将excel作为同一模型的输入运行,以查看错误率,结果为0。你能告诉我为什么吗?

    请看下面的截图






    Jasmine_
  • User111113User111113 成员职位:24Maven
    我又做了一件事,我觉得这次我做对了。

    上面生成的结果集来自于模型,将相同的数据输入到模型中,显然会出现0偏差。

    现在我放入原始数据,例如,我预测了2019年11月的响应率,我已经有了实际/原始数据,所以我把它作为输入,看看结果集偏离原始数据的程度,我得到的均方根误差为0.016

    这还不错,你觉得呢?
    varunm1 Jasmine_
  • varunm1varunm1 主持人,职位:1207年独角兽
    如果这个2019年11月的数据不在你的训练中,那么RMSE很低,这很好。你可以尝试不同的模式,看看你是否能做得更好
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    User111113 Jasmine_
  • EnragedWaspEnragedWasp 成员职位:1新手
    现在我放入原始数据,例如,我预测了2019年11月的响应率,我已经有了实际/原始数据,所以我把它作为输入,看看结果集偏离原始数据的程度,我得到的均方根误差为0.016
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    基本上,要找到新评分数据的性能,您将需要等待足够的时间,直到您使用嵌入在原始模型开发示例中的相同逻辑来分配标签。然后,您可以加载它并将其与包含预测的数据集合并,然后在合并的数据集上使用典型的性能运算符来查看模型的运行情况。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    Jasmine_
登录注册置评。