“关联规则”

bkrugerbkruger 成员职位:17Maven
2019年5月编辑 帮助
我每天都在使用它,我越来越喜欢Rapidminer !我有个问题,请帮忙好吗?

我在数据库中有以下数据。客户ID、事务ID和他们购买的物品。我用读取数据库操作符将数据读取到Rapidminer中。我准备数据,做一个fp增长和关联规则——所有工作都很好,我得到了好的规则。

客户事务IItem1 Item2 Item3 Item4
11 a b
12 a b c
13 a c d
14 .选b
21 a c
2 c d
2 3 d
2 .选c

我的问题是:

我不是Rapidminer专家,我想知道是否有一种方法可以获得频繁的项目集顾客,这样我就可以把它们相互比较一下。目前,它查看整个集合的规则

为了避免这个问题,我在查询中添加了一个where子句(where Customer = ' 1 '),然后手动将结果输入Excel并为每个客户重复。这是一种令人沮丧的缓慢和“愚蠢”的方式——我知道。有什么办法能让我的生活更轻松吗?

我的第二个问题是:如何将FP结果或关联规则结果返回到数据库或CSV中,以便在DB端进行进一步处理?当您尝试将这些结果转换为writeddatabase时,它不起作用。

提前感谢你的巧妙建议:)

汉堡王

答案

  • bkrugerbkruger 成员职位:17Maven
    你好再次,

    没有想法吗?必须有一种方法来做一个过程的数据子集,然后循环通过它为每个子集?

    干杯
    汉堡王
  • nandadoreanandadorea 成员职位:14因素二世
    我正试图找出同样的事情-如何保存频繁的项目集。如果我将“free”输出连接到结果,我就可以看到结果,但我不想“看到”它们,我希望能够比较两个子集的结果。

    至于获取每个数据子集的频繁集,我也采用了较长的路线:我将数据集分成两个,并为每个数据集独立运行FP-Growth节点。它工作得很好,我得到了两个结果,但现在我需要一些方法来保存这些结果,以便我可以操作/比较。

    总而言之:从FP-Growth节点的“自由”输出端口,我可以去哪里?我可以把它存到哪里?
  • nandadoreanandadorea 成员职位:14因素二世
    要是我从头开始就好了……我在RapidMiner教程上找到了我的答案,我按照FP-Growth的顺序,使用节点“创建关联规则”和“应用关联规则”实现了我的目标。最后一个的输出作为示例数据集返回。希望你也能有好运。
登录注册置评。