"FPGrowth/ associationrule Generator -过滤无用的规则"
你好,
我目前正在使用如下结构的示例集测试FPGrowth算法
Id attribute1 attribute2 attribute3
-----------------------------------------------------
4711真假真
4712假假假
…
现在,FPGrowth后面跟着AssociationRuleGenerator生成如下规则
如果attribute1 = 0,则attribute2 => 0
这些规则并不重要(至少对我来说),因为它们只是说,如果attribute1没有出现,attribute2也不会出现。
是否有其他方法可以从FrequentItemset中过滤这些规则?我测试了fpgrowth参数。”必须包含使用简单的正则表达式“attribute1 = 1”,但它有没有影响
谢谢你的帮助!
沃纳
我目前正在使用如下结构的示例集测试FPGrowth算法
Id attribute1 attribute2 attribute3
-----------------------------------------------------
4711真假真
4712假假假
…
现在,FPGrowth后面跟着AssociationRuleGenerator生成如下规则
如果attribute1 = 0,则attribute2 => 0
这些规则并不重要(至少对我来说),因为它们只是说,如果attribute1没有出现,attribute2也不会出现。
是否有其他方法可以从FrequentItemset中过滤这些规则?我测试了fpgrowth参数。”必须包含使用简单的正则表达式“attribute1 = 1”,但它有没有影响
谢谢你的帮助!
沃纳
0
答案
现在它产生的规则开始于
如果属性= 1,则....
但是生成的规则并不依赖于正确的数据。相反,您现在使用的是倒置的数据:每个假都被视为真。在正常的交易数据中,虚假情况比真实情况要频繁得多。因此,基于错误情况的规则将有更大的支持。这就是为什么当你切换回“true”时,你会发现一些规则而不是规则。如果没有找到规则,您可能会降低对查找规则的支持。
问候,
塞巴斯蒂安。