最好的答案
-
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:913独角兽嗨@gold!
关联分析与分类有很大的不同。您所提到的性能度量只适用于分类,它们在关联上下文中没有意义。
看看fp成长的教程过程,可从帮助。与创建关联规则在FP-Growth之后,您确实获得了适用于关联规则挖掘的具体度量(提升、支持、信心等)。
还有应用关联规则。可以构建一个更复杂的流程,将一组关联规则应用于新项集。
您应该能够使用它来预测添加到购物篮或其他项目集,然后检查预测是否正确。您需要将此数据转换为适合分类的表格形式(每行一个项目集)。在那里,您将拥有一个带有角色预测的属性(来自Apply Association Rules)和一个带有标签的属性(实际添加的属性)。这种结构适用于性能(分类)或性能(二项分类)取决于您如何选择预测和标签属性。(它们可以是实际的项目,也可以是一个特定项目的真/假。)
问候,
Balazs0 -
BalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:913独角兽
答案
谢谢您的指导
如何将此数据转换为适合分类的表格形状(每行一个项目集)。
以及如何拥有一个带有角色预测的属性(来自应用关联规则)和一个带有标签的属性(实际添加)。这意味着我必须在关联规则之后使用set role ?这可能吗?
嗨BalazsBarany
谢谢您的指导
如何将此数据转换为适合分类的表格形状(每行一个项目集)。
以及如何拥有一个带有角色预测的属性(来自应用关联规则)和一个带有标签的属性(实际添加)。这意味着我必须在关联规则之后使用set role ?这可能吗?
谢谢您的指导
如何将此数据转换为适合分类的表格形状(每行一个项目集)。
以及如何拥有一个带有角色预测的属性(来自应用关联规则)和一个带有标签的属性(实际添加)。这意味着我必须在关联规则之后使用set role ?这可能吗?
但我的数据集和其他数据集不同,我用的是Movielens 100k数据集,所以我不能用pivot,因为数据集的原因。
我把我的项目发给你了。
提前感谢你的帮助
我下载了数据并执行了你的程序。它似乎工作,但你有小错误在生成属性,例如儿童小于10年也被认为是青少年。
现在你要解决的问题会很有趣。
例如,您可以将数据分成训练集和测试集,并将学习到的规则应用于测试集。然后,您将检查您感兴趣的属性中的结论(例如,良好评级)。然后将预测结果与实际结果进行比较。
然而,如果“良好评级”是您的目标属性,那么对这些数据应用直接分类要比关联分析容易得多。
问候,
Balazs