升降图表-在较低的十分位数的改进
我知道这里有很多关于电梯图表的讨论,包括这个,https://community.www.turtlecreekpls.com/discussion/55773/about-lift-chart但我不得不承认,我想知道为什么在我的许多例子(不同的数据集,不同的技术)中,Lift图表(或简单的Lift图表)输出显示的情况是,命中率/转化率实际上是在向右增加十分位数。根据定义,数据按照目标类的置信度排序,按降序排列,您通常会看到命中率随着每一个十分位数而下降,正如我在不同工具中使用相同的数据集/技术所做的那样。
即使在我上面链接的例子中,命中率实际上在十分位数6中上升。诚然,我很少看到这种情况,所以我想知道你是否有一个解释或直觉,为什么这种情况在RM中如此频繁地出现。
以上,结果来自逻辑回归。
最后但并非最不重要的是,是否有办法在这些图表上设置一条参考线来显示目标的基线百分比?我认为这真的会简化可视化让人们更好地理解升力的概念。
即使在我上面链接的例子中,命中率实际上在十分位数6中上升。诚然,我很少看到这种情况,所以我想知道你是否有一个解释或直觉,为什么这种情况在RM中如此频繁地出现。
以上,结果来自逻辑回归。
最后但并非最不重要的是,是否有办法在这些图表上设置一条参考线来显示目标的基线百分比?我认为这真的会简化可视化让人们更好地理解升力的概念。
标记:
0
最佳答案
-
IngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人嘿,
1)简单LC vs. LC真的建议使用较新的升降机图(简单)版本,当阈值非常接近时,另一个版本有点不稳定。这通常会导致—就像在您的示例中一样—您将无法获得所需的桶数。这种情况通常发生在较小的数据集(如您的283个示例)和/或仅产生有限的离散置信度值集的模型(如决策树)。
2)参考线:这目前是不可能的,但确实可能是一个好主意。榜单可能会变得更加繁忙,但绝对值得一试。
3)斜率变化:这确实可能发生,特别是(如上所述)对于较小的数据集和/或具有有限置信度值的模型,例如决策树。我知道有些工具有时会在可视化中“作弊”以避免这种情况,但我个人更喜欢看到这种TBH。如上所述,对于更大的数据集和像朴素贝叶斯和其他产生更细粒度置信度值的模型,这种情况不太可能发生。
希望这能帮到你,
Ingo
5
答案
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询