“关联规则”
我每天都在使用它,我越来越喜欢Rapidminer !我有个问题,请帮忙好吗?
我在数据库中有以下数据。客户ID、事务ID和他们购买的物品。我用读取数据库操作符将数据读取到Rapidminer中。我准备数据,做一个fp增长和关联规则——所有工作都很好,我得到了好的规则。
客户事务IItem1 Item2 Item3 Item4
11 a b
12 a b c
13 a c d
14 .选b
21 a c
2 c d
2 3 d
2 .选c
我的问题是:
我不是Rapidminer专家,我想知道是否有一种方法可以获得频繁的项目集每顾客,这样我就可以把它们相互比较一下。目前,它查看整个集合的规则.
为了避免这个问题,我在查询中添加了一个where子句(where Customer = ' 1 '),然后手动将结果输入Excel并为每个客户重复。这是一种令人沮丧的缓慢和“愚蠢”的方式——我知道。有什么办法能让我的生活更轻松吗?
我的第二个问题是:如何将FP结果或关联规则结果返回到数据库或CSV中,以便在DB端进行进一步处理?当您尝试将这些结果转换为writeddatabase时,它不起作用。
提前感谢你的巧妙建议
汉堡王
我在数据库中有以下数据。客户ID、事务ID和他们购买的物品。我用读取数据库操作符将数据读取到Rapidminer中。我准备数据,做一个fp增长和关联规则——所有工作都很好,我得到了好的规则。
客户事务IItem1 Item2 Item3 Item4
11 a b
12 a b c
13 a c d
14 .选b
21 a c
2 c d
2 3 d
2 .选c
我的问题是:
我不是Rapidminer专家,我想知道是否有一种方法可以获得频繁的项目集每顾客,这样我就可以把它们相互比较一下。目前,它查看整个集合的规则.
为了避免这个问题,我在查询中添加了一个where子句(where Customer = ' 1 '),然后手动将结果输入Excel并为每个客户重复。这是一种令人沮丧的缓慢和“愚蠢”的方式——我知道。有什么办法能让我的生活更轻松吗?
我的第二个问题是:如何将FP结果或关联规则结果返回到数据库或CSV中,以便在DB端进行进一步处理?当您尝试将这些结果转换为writeddatabase时,它不起作用。
提前感谢你的巧妙建议
汉堡王
标记:
0
答案
没有想法吗?必须有一种方法来做一个过程的数据子集,然后循环通过它为每个子集?
干杯
汉堡王
至于获取每个数据子集的频繁集,我也采用了较长的路线:我将数据集分成两个,并为每个数据集独立运行FP-Growth节点。它工作得很好,我得到了两个结果,但现在我需要一些方法来保存这些结果,以便我可以操作/比较。
总而言之:从FP-Growth节点的“自由”输出端口,我可以去哪里?我可以把它存到哪里?