如何使用rapidminer实现关联规则建模?

vilencyvilency 成员职位:6因素二世
2019年6月编辑 帮助
对不起,我是一个新手,我不知道如何使用关联规则建模。我有半二进制数据…正如我在辅导课上读到的。进程必须检索->预处理->fp-growth->关联规则。我已经做了数据检索(已经从excel导入),然后我困惑如何进行预处理?你能帮我吗?谢谢您的关注
Idjualk226 k227 k228 k229 k230 k231 k232 k233 k237 k239
1 0 0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0
3 0 0 0 0 0 0 0 0 0
4 0 0 0 0 0 1 0 0 0 0
5 0 0 0 0 0 0 0 0 0
6 0 0 0 0 0 1 0 0 0 0
7 0 0 0 0 0 1 0 0 0 0
8 0 0 0 0 0 1 0 0 0
9 0 0 0 0 0 0 0 0 0 0
10 0 0 0 0 0 10 0 0 0
11 0 0 0 0 0 0 0 0 0
12 0 0 0 0 0 1 0 0 0 0
13 0 0 0 0 0 1 0 0 0 0
14 0 0 0 0 0 0 0 0 0
15 0 0 0 0 1 1 0 0 0 0 0
16 0 0 0 0 0 0 0 0 0
17 0 0 0 0 0 0 0 0
18 1 0 0 1 1 0 0 0 0 0
19 0 0 0 0 0 0 0 0 0 0
20 0 0 0 0 0 0 0 0 0 0
21 0 0 0 0 0 0 0 0 0
22 0 0 0 0 0 0 0 0
23 0 0 0 0 0 1 0 0 0 0
24 0 0 0 0 0 1 0 0 0 0
25 0 0 0 0 0 0 0 0
26 0 0 0 0 0 1 0 0 0 0
27 0 0 0 0 0 0 1 0 0 0 0
28 0 0 0 0 0 0 0 0 0
29 0 0 0 0 0 0 0 0 0
30 0 0 0 0 0 1 0 0 0 0
31 0 0 0 0 0 0 0 0 0
32 0 0 0 0 0 0 0 0 0
33 0 0 0 0 0 0 0 0 0
34 0 0 0 0 0 0 0 0 0
35 0 0 0 0 0 0 0 0
36 0 0 0 0 0 0 0 0 0
37 0 0 0 0 0 0 1 0 0 0 0
38 0 0 0 0 0 1 0 0 0 0
39 0 0 0 0 0 0 0 0 0
40 0 0 0 0 0 0 0 0 0 0
41 0 0 0 0 0 0 0 0 0
42 0 0 0 0 0 0 0 0 0
43 0 0 0 0 0 0 0 0 0
44 0 0 0 0 0 0 0 0 0
45 0 0 0 0 0 0 0 0
46 0 0 0 0 0 0 0 0
47 0 0 0 0 0 0 0 0 0
48 0 0 0 0 0 0 0 0 0
49 0 0 0 0 0 0 0 0 0
50 0 0 0 0 0 0 0 0 0
51 0 0 0 0 0 1 1 0 0 0 0
52 1 0 0 0 0 0 0 0 0
53 0 0 0 0 0 0 0 0
54 0 0 0 0 0 1 0 0 0
55 0 0 0 0 0 0 0 0
56 0 0 0 0 0 0 0 0 0
57 0 0 0 0 0 0 0 0 0
58 0 0 0 0 0 1 0 0 0
Idjual是销售id
k299和…是一类

答案

  • 黑线鳕黑线鳕 成员职位:849Maven
    你好,

    你是对的,如果你有一列0和1,我会假设它是二进制/二项式的,但是RM需要被告知。无论如何,如果我把你的数据作为CSV保存,我可以从中生成规则,好吧,前提是我把标准设置得很低!这就是. .

    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.0 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文




    < /操作符>



    < /操作符>



    < /操作符>


    < /操作符>










    > < /过程
    < /操作符>
    > < /过程
  • vilencyvilency 成员职位:6因素二世
    1.它的经验。谢谢黑线鳕...im so appreciate it. As you said that it would generated rule if the bar set low(you mean minimum support and minimum confidence right?)
    2、是不是因为样本的数据这么少?实际上真实的数据是80000条记录,如果我把它放在快速矿工会影响结果吗?
    3.如果数据是80000条记录,我应该如何设置最小支持度和最小置信度才能做出准确的预测结果?
    4.我仍然对结果感到困惑(电子邮件保护)也许因为我是采矿业的新手
    拉普拉斯,增益,p-s,信念是什么意思?我只懂得支持和自信。抱歉我问了这个…
    谢谢
  • 黑线鳕黑线鳕 成员职位:849Maven
    你好,

    以下是我的答案。

    1.是的。
    2.数据越多,运行时间越长。
    3.只要你相信就行!!没有唯一的正确答案。
    4.我把它收藏起来了http://michael.hahsler.net/research/association_rules/measures.html

    玩得开心…

  • vilencyvilency 成员职位:6因素二世
    嗨. .
    我想问,是吗设置角色之前从数字到二项式过程中,它意味着告诉RM哪些字段必须转换为二项,哪些字段不需要转换?
    谢谢
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    默认情况下,特殊属性(=角色不同于常规属性的属性)将被排除在转换为二项式的之外。此行为由数值到二项运算符上的属性子集选择参数定义。
    因此,将第一列设置为特殊角色“id”,它将被排除在此转换之外,除非您更改参数设置。


    问候,
    塞巴斯蒂安。
  • vilencyvilency 成员职位:6因素二世
    谢谢塞巴斯蒂安
    我已经做了直到创建关联规则的过程。如果成功产生
    一些规则。
    1.我想知道的是下一个过程的功能,比如应用关联规则,
    广义顺序模式,统一项目集。
    2.如果我只想生成关联规则,我必须在哪里停止应用流程?创建关联规则或
    在统一的项目设置?
    3.在结果视图中,我们可以从关联规则结果中看到有表视图、文本视图、图视图、注释
    注释的功能是什么?什么时候我们必须使用它呢?
    4.例如,在元数据视图中将数值设置为二项式。有统计值“mode=false(12709),least=true(4161)”。这是什么意思?
    对不起,如果我要求太多了……再次感谢你回复我的帖子。长寿快速矿工!!呵呵^ ^
  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    我将按顺序回答:
    1.请查看操作人员文档,了解每个操作人员的工作。
    2.如果您想要关联规则,我建议您在生成它们之后就应该停止了。
    3.你不必使用注释视图。有些操作符会对它们生成的结果进行注释。例如,读数据库操作符将把用于检索示例集的查询附加到示例集。
    4.模式是一个属性最常出现的标称值。“Least”是最不常出现的。大惊喜,不是吗?: P

    问候,
    塞巴斯蒂安。
  • vilencyvilency 成员职位:6因素二世
    大家好
    关联规则结果中有have、support、confidence、laplace、gain、conviction、lift、p-s
    我已经理解了支持,信心,鼓舞,信念。
    我想问如何计算拉普拉斯,增益,p-s,以及它在关联规则中的作用?有人有这方面的教程吗?
    谢谢你!

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    我建议你看一下维基百科。每项措施都应该在那里解释,否则谷歌搜索会帮助你。当然,在我们的网络研讨会上,我们热切地向您介绍所有这些措施以及与关联规则挖掘相关的其他内容。详情见商店。

    问候,
    塞巴斯蒂安。
登录注册置评。