“如何解释关联规则创建的结果”

MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
2019年6月编辑 知识库

问题

创建关联规则操作符在规则上创建各种统计度量。他们告诉我什么?

回答

最重要的标准已经记录在操作员帮助中

  • 信心:规则的置信度定义为conf(X implies Y) = supp(X∪Y)/supp(X)。阅读表达式时要小心:这里的supp(X∪Y)表示“支持同时出现X和Y的事务”,而不是“支持同时出现X或Y的事务”。置信区间为0 ~ 1。置信度是对Pr(Y | X)的估计,即在给定X的情况下观察到Y的概率。项目集X的支持度(X)定义为数据集中包含该项目集的交易的比例。
  • 电梯规则的升力定义为lift(X暗示Y) = supp(X∪Y)/((supp(Y) X supp(X)),或者如果X和Y独立,则观测到的支撑与预期的支撑之比。Lift也可以定义为Lift (X暗示Y) =conf(X暗示Y)/supp(Y)。升力测量的是X和y离独立的距离有多远,它的范围从0到正无穷。接近1的值意味着X和Y是独立的,规则不有趣。
  • 信念:信念对规则方向很敏感,即conv(X暗示Y)与conv(Y暗示X)不同。信念在某种程度上受到含义的逻辑定义的启发,并试图衡量规则的含义程度。定罪定义为conv(X暗示Y) =(1 - supp(Y))/(1 - conf(X暗示Y))

有一篇很棒的论文http://www4.di.uminho.pt它深入解释了所有参数。PS (Piatesky-Shaprio的缩写)在文件中被称为杠杆。

- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德
David_A gracylayla6 f_soldi imke
    登录注册置评。