“如何在每个折叠中访问训练和测试实例以进行n折叠交叉验证”

kashif_khankashif_khan 成员职位:19贡献我
2019年6月编辑 帮助
嗨,伙计们,

我正在研究RapidMiner中的数据挖掘问题,其中我必须访问每个折叠中的实例,以便与分类器进行n折叠交叉验证。我可以访问验证操作符的“测试”子过程中的实例,因为它给了我一个“ExampleSet”的实例,但不能访问产生“DistributionModel”实例的“训练”子过程中的实例。我试图在我的代码中迭代它们。我怎样才能得到在测试和训练的实例分开为每个折叠?我怎样才能将distributionmodel转换为ExampleSet ?

我真的很感谢你的帮助……

答案

  • Marco_BoeckMarco_Boeck 管理员、版主、员工、会员、大学教授职位:1984年RM工程
    你好,

    1)当你在RapidMiner Studio GUI中打开X-Validation操作符时,你会在左侧看到一个“训练”子过程,在右侧看到一个“测试”子过程。请注意每个子流程右上方的端口。如果您希望在代码中访问它们的数据,则需要将它们连接起来。因此,如果您想要访问训练数据,就必须将其管道连接到“thr”端口。
    另一种选择是访问左边的输入端口而不是右边的输出端口。这样您就可以访问进入每个子进程的任何内容。

    2)你不能将DistributionModel转换为一个ExampleSet。ExampleSet是您的实际数据(想想数据库表),而DistributionModel是一个用于根据您的实际数据生成预测的模型。它们是完全不同的东西。

    问候,
    马可
登录注册置评。