解释交叉验证中的预测:错误

varunm1varunm1 主持人,职位:1207年独角兽
2019年8月编辑 帮助
你好,

我正在研究一个过程,需要在交叉验证操作符的测试过程中解释预测操作符。我在交叉验证(训练)中使用前向特征选择方法,该方法选择支持预测的相关特征,但是当我将这些作为输入提供给解释预测的“传输”端口和交叉验证的“测试”到解释预测操作符的“测试”时,它抛出了一个错误。

我希望选择由前向选择给出的属性,并将相同的属性应用于解释预测的测试端口,以便它不会抛出错误。目前,所有的特征都进入了解释预测的测试端口,而不是进入训练端口,因为训练是在特征选择的属性上完成的。

在没有解释预测的情况下,这一过程运行良好。我附加了数据。ioo文件,这些文件可以直接放在存储库中,并在此线程中处理。

我使用自动特征工程算子进行相同的过程,并没有遇到任何问题,我的理解是自动特征工程给出的是特征,而不是像转发选择那样的特征选择样例集。其中,我只是使用了apply feature set算子,使进入解释预测算子的训练和测试数据具有相同的属性。



@IngoRM

谢谢你的建议。
问候,
Varun
https://www.varunmandalapu.com/

是安全的。遵循预防措施并保持社交距离

Tghadially

最佳答案

  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    解决方案接受
    你好,
    另一个想法是使用由特征选择产生的“权重”并将它们传递到直通端口。在测试部分,您可以使用操作符“Select by Weights”来复制相同的属性集。
    希望这能帮到你,
    Ingo
    sgenzer varunm1 Tghadially

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    您是否尝试了对需要从列车传递到测试集的属性使用Remember/Recall组合?这是可行的。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    Tghadially sgenzer
  • varunm1varunm1 主持人,职位:1207年独角兽
    你好布莱恩,

    我通过CV的“直通”端口,将特征选择准确选择的训练数据传递给解释预测。我唯一的问题是测试数据。交叉验证中的测试数据来自整个数据集,所以它由所有属性组成,这使得基于我的理解的解释预测抛出错误。我只是在寻找一种方法来过滤基于训练属性的测试数据中的属性。

    我看看我能用Remember/Recall做些什么。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    Tghadially
  • varunm1varunm1 主持人,职位:1207年独角兽
    谢谢@IngoRM

    我有一个问题。当我将具有所有属性的数据集传递给应用模型时,它不会抛出错误,但对于解释预测,它会抛出前面指定的错误。应用模型是否自动过滤掉在模型构建中未使用的属性并且解释预测无法做到这一点?

    谢谢你的建议。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    Tghadially
  • IngoRMIngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人
    解释预测的飞行前检查确实比应用模型的检查要严格一些。在下一个版本中,我们已经使类型检查变得不那么严格了,但我还将研究超集的限制……
    varunm1 Tghadially
  • varunm1varunm1 主持人,职位:1207年独角兽
    谢谢,@IngoRM这就解决了我的问题。
    问候,
    Varun
    https://www.varunmandalapu.com/

    是安全的。遵循预防措施并保持社交距离

    Tghadially
登录注册置评。