性能(成本)样本不符合预期

MaartenKMaartenK 成员职位:17因素二世
我正在调查性能(成本)部分。它有一个教程。本教程使用分割验证对Golf数据集应用朴素贝叶斯。结果应该是4个项目中的1个被错误分类。然而,如果我运行它,所有项目被错误分类如下(play ->预测):
是->否,否->是,是->否,是->否)。
我的同事没有这个结果。我在AMD Ryzen 5 3600上运行RapidMiner 9.8.001。
我没有改变教程中的任何参数。
我还从头开始重建模型,得到了相同的结果。
标记:

最佳答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    解决方案接受
    @MaartenK

    我只能重现你所观察到的,如果:
    -我检查过了使用当地的随机种子局部随机种子= 1992的参数中分割验证操作符

    否则,如果使用当地的随机种子未经检查,我确实有25%的样本分类错误就像你的同事....

    这样你就确信你没有检查过使用当地的随机种子的参数中分割验证操作符。

    问候,

    莱昂内尔

答案

  • MaartenKMaartenK 成员职位:17因素二世
    2020年12月编辑
    嗨,莱昂内尔,

    一定是这样。1992是RM以前版本中默认的本地随机种子,我将其设置为默认值,以便能够复制我论文中的结果。当前的违约是2001年。如果我使用它,那么它就会像帮助中描述的那样工作。
    仍然有趣的是,如何产生如此不同的结果(4个分类错误vs 1个)。可能是因为高尔夫数据集非常小。
    感谢您的快速回复!

登录注册置评。