异常扩展生成ROC似乎反映FP/FN率
我正在对人工数据集使用异常扩展。我用三种算法给异常评分。它们是K-NN Global, uCBLOF和LOF。我的数据集包含一个应该出现的异常的标签。我使用Generate ROC来衡量性能。GenerateROC首先做的是为异常值分数选择一个阈值,并添加一个布尔值“预测”。我注意到,在产生的混淆矩阵中,FP和FN计数总是相同的。它似乎是根据标签选择阈值来生成异常值的。这似乎很奇怪。
该数据集包含1676个标记为“true”的项目。
请参阅下面使用标签作为颜色的分数历史图。可以看出,它没有给异常值一个高分。这是因为我们的数据集包含全球异常。为了便于阅读,y轴不是对数的。
下面是由Generate ROC生成的混淆矩阵。它包含1676个FN,这是可以解释的,如果你看分数。
然而,它也包含1676个FP,这是可疑的。我看了看数据集,确实有1676个预测值为“真”,所以这不是一个绘图问题。
我忽略了什么?
该数据集包含1676个标记为“true”的项目。
请参阅下面使用标签作为颜色的分数历史图。可以看出,它没有给异常值一个高分。这是因为我们的数据集包含全球异常。为了便于阅读,y轴不是对数的。
下面是由Generate ROC生成的混淆矩阵。它包含1676个FN,这是可以解释的,如果你看分数。
然而,它也包含1676个FP,这是可疑的。我看了看数据集,确实有1676个预测值为“真”,所以这不是一个绘图问题。
我忽略了什么?
0
最佳答案
-
MaartenK 成员职位:15因素二世
答案