“当x验证创建没有正例的分区时会发生什么?”

DrGaryDrGary 成员职位:8因素二世
2019年5月编辑 帮助

如果数据集是倾斜的,那么正反例集的大小就不平衡。例如,当试图学习罕见事件检测器时,偏差是很常见的。

假设数据集只有1个正例。那么交叉验证只能产生一个具有正例的训练子集;其他人将没有正面的例子。会发生什么?当没有一个积极的例子训练时,RapidMiner模型做什么?

我之所以问这个问题,是因为我在模型训练中看到了一个Java Exception,我可以追溯到一个没有正例的XVal分区。

在这种情况下,是否有一种方法可以检测到这种情况并跳过培训?

谢谢,
加里
标记:

答案

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好加里,
    可能模型对此无能为力:如果没有这两个类的示例,您就无法学会将它们分开。针对“一类”情况的算法很少,一类支持向量机就是其中之一。但我不知道LibSVM实现将做什么,如果真的只有一个类。
    在我看来,你只有两个选择:
    -尝试引导算子乘以你的正例,这样学习者在每个XValidation折叠中都有例子。
    或者你可以提取正例并将其添加到每个训练数据中。下面的过程会用到它,但请记住,
    这样就破坏了性能评估的目标,因为测试集中也会有一部分训练数据……



    < /操作符>


    < /操作符>



    < /操作符>



    < /操作符>






    < /操作符>

    < /操作符>

    < /操作符>
    < /操作符>


    <列出关键= " application_parameters " >
    < / >列表
    < /操作符>

    < /操作符>
    < /操作符>
    < /操作符>
    < /操作符>
    问候,
    塞巴斯蒂安。
登录注册置评。