“为关联规则挖掘选择数据子集。”

ckwchengckwcheng 成员职位:6因素二世
2019年6月编辑 帮助
下面是我想用于关联规则挖掘的数据子集。它是一个半二进制表

9762 cn14 0 0 0 0 0 1
9763 cn07 0 0 0 0 0 1
9764 cn07 0 0 0 0 0 1
9765 cn14 0 0 0 0 0 1
9766 cn14 0 0 0 0 0 1
9767 cn33 0 0 0 0 0 1
9768 cn02 0 0 0 0 0 1
9769 cn12 0 0 0 0 0 1
9770 cn14 0 0 0 0 0 1
9771 cn04 0 0 0 0 0 1
9772 cn04 0 0 0 0 0 1
9773 cn04 0 0 0 0 0 1
9774 cn05 0 0 0 0 0 1
9775 cn07 0 0 0 0 0 1
9776 cn07 0 0 0 0 0 1
9777 cn07 0 0 0 0 0 1
…等。

我想分别找出CN07, CN14等的关联规则。也就是说,我想找到CN07的关联规则,然后寻找CN14的关联规则,以此类推。为了选择一个子集来运行关联规则挖掘器,我必须执行哪些数据预处理步骤?我用的是Rapidminer 5。

任何帮助都非常感激!谢谢!

答案

  • 土地土地 RapidMiner认证分析师,RapidMiner认证专家,成员职位:2531年独角兽
    你好,
    您可以使用过滤器示例操作符来选择示例集的子集。如果你想自动循环遍历一个属性的所有值,你可以看看下面的过程:
    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.0 " >
    > <上下文
    <输入>
    <位置/ >
    输入> < /
    < >输出
    <位置/ >
    <位置/ >
    < / >输出
    <宏/ >
    > < /上下文





    < /操作符>






    < /操作符>











    > < /过程
    < /操作符>






    > < /过程
    < /操作符>
    > < /过程
    问候,
    塞巴斯蒂安。
登录注册置评。