属性不匹配

TuvokbubkaTuvokbubka 成员职位:5新手
2021年5月编辑 帮助
我应该用旧数据创建一个预测模型进行训练,然后将其应用于新的数据集。然而,当我试图将其应用到我的新数据集时,它说有缺失的属性。我尝试了许多组合,但都无法解决这个问题。

如果有人知道我如何解决这个问题,欢迎帮助,

谢谢你!
标记:

答案

  • kaymankayman 成员职位:662独角兽
    你在旧的和新的集合上删除相关的属性,很可能其中一个被删除的属性(在本例中是SC_MCV)在训练集中不被认为是相关的。或者在一组中高于阈值,在另一组中低于阈值……

    因此,您需要确保为CSV 1和CSV(3)保留的属性与用于您的模型的属性相同。尽管我认为您实际上可以从测试集中删除相关属性过滤器,因为未使用的属性可能会被忽略。
  • TuvokbubkaTuvokbubka 成员职位:5新手
    我尝试删除“删除相关”的两个数据集,它仍然给我同样的错误

  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    较低的流有一个额外的标称到数值(在设置角色和规范化之间)。
    这很可能会导致它。

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
  • TuvokbubkaTuvokbubka 成员职位:5新手
    它仍然给我一个错误....
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    你好,
    下游是否存在N-PRVR ?尝试使用断点来找出N_PRVR没有转换的原因。
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
  • TuvokbubkaTuvokbubka 成员职位:5新手
    N-PRVR确实存在,但不像示例集那样分成不同的列。
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    那么,它是什么类型?很可能在下游是一个数字,而在上游是一个名义。
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
  • TuvokbubkaTuvokbubka 成员职位:5新手
    在这两种情况下,它们都是数值,但在原始数据集中,它们是名义上的,我相信这是因为当转换为虚拟变量时,值npvrv =1在新的数据集中不存在。因为我尝试在两个数据集中删除属性,它给了我另一个属性相同的问题。所以我得出的结论是,这是因为在第一个数据集中有第二个数据集中没有的值,这在重新编码虚拟变量时产生了问题。但我不知道如何解决或者是否有可能解决?

    非常感谢你的帮助
  • MartinLiebigMartinLiebig 管理员,主持人,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3287年RM数据科学家
    你好,
    我认为你想在使用标称数值之前在上游使用解析数字操作符。

    最好的
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管-
    德国多特蒙德
登录注册置评。