“关联规则”

bkruger · 2011年4月

我每天都在使用它，我越来越喜欢Rapidminer !我有个问题，请帮忙好吗?

我在数据库中有以下数据。客户ID、事务ID和他们购买的物品。我用读取数据库操作符将数据读取到Rapidminer中。我准备数据，做一个fp增长和关联规则——所有工作都很好，我得到了好的规则。

客户事务IItem1 Item2 Item3 Item4
11 a b
12 a b c
13 a c d
14 .选b
21 a c
2 c d
2 3 d
2 .选c

我的问题是:

我不是Rapidminer专家，我想知道是否有一种方法可以获得频繁的项目集每顾客，这样我就可以把它们相互比较一下。目前，它查看整个集合的规则．

为了避免这个问题，我在查询中添加了一个where子句(where Customer = ' 1 ')，然后手动将结果输入Excel并为每个客户重复。这是一种令人沮丧的缓慢和“愚蠢”的方式——我知道。有什么办法能让我的生活更轻松吗?

我的第二个问题是:如何将FP结果或关联规则结果返回到数据库或CSV中，以便在DB端进行进一步处理?当您尝试将这些结果转换为writeddatabase时，它不起作用。

提前感谢你的巧妙建议

汉堡王

bkruger · 2011年4月

你好再次,

没有想法吗?必须有一种方法来做一个过程的数据子集，然后循环通过它为每个子集?

干杯
汉堡王

nandadorea · 2011年6月

我正试图找出同样的事情-如何保存频繁的项目集。如果我将“free”输出连接到结果，我就可以看到结果，但我不想“看到”它们，我希望能够比较两个子集的结果。

至于获取每个数据子集的频繁集，我也采用了较长的路线:我将数据集分成两个，并为每个数据集独立运行FP-Growth节点。它工作得很好，我得到了两个结果，但现在我需要一些方法来保存这些结果，以便我可以操作/比较。

总而言之:从FP-Growth节点的“自由”输出端口，我可以去哪里?我可以把它存到哪里?

nandadorea · 2011年6月

要是我从头开始就好了……我在RapidMiner教程上找到了我的答案，我按照FP-Growth的顺序，使用节点“创建关联规则”和“应用关联规则”实现了我的目标。最后一个的输出作为示例数据集返回。希望你也能有好运。

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

“关联规则”

答案