“关联规则”

iodeaniodean 成员职位:2贡献我
2019年6月编辑 帮助
我是RM的新人,我一直在阅读《面向大众的数据挖掘》这本书。我的第一个问题与操作符“创建关联规则”有关。在“显示规则匹配”下,它似乎选择了来自FP增长的前4或5个属性组合。是否可以控制应该在规则中显示哪些属性?

我的第二个问题与如何替换缺失的值有关-是否有办法用一定百分比的随机分配值来替换缺失的值。例如,使用UCI机器学习存储库中的国会投票记录,是否有办法以60:40的比例随机选择“是”或“否”来取代缺失的投票?

谢谢你!

答案

  • MariusHelfMariusHelf RapidMiner认证专家、会员职位:1869年独角兽
    你好,

    下次请用一个帖子回答一个问题,这有助于我们保持论坛的整洁和结构。

    关于关联规则,您不能定义所选择的属性—如果您想这样做,您也可以手工创建规则,并取消操作符。但是,您可以修改阈值,以便只保留具有给定置信度的规则。



    替换缺失值操作符不允许这种替换,但是你也可以使用像这样的表达式来生成属性:
    如果(缺少(属性),如果(rand() < 0.4, "是","否"),属性)
    最好的问候,
    马吕斯
登录注册置评。