“生成关联规则的问题”

riddler16riddler16 成员职位:2贡献我
2019年6月编辑 帮助
嗨,我是新来的,我有一个关于fp算法,关联规则,特别是关于缓冲的问题:)

我的整个RM过程非常简单。我从一个csv文件中读取了大约2000个交易。然后有一个预处理步骤,使用一个名义二项运算符。输出到fp-growth, fp-growth之后输出到AssociationRulesGenerator。
一切都很好……直到我选择一个低支撑。(约0.2)。
我得到错误消息,我必须更少的内存,我应该更新它或尝试缓存的数据库操作符。我已经用超过10GB的内存试过了,仍然一样:(
我的问题是,是否有机会得到这些规则?也许通过缓存结果或写入文件或类似的东西?
问题不在于fp增长算法。至少我是这样认为的,因为RM底部的状态栏在几秒钟后告诉我,fp增长计算已经结束,现在开始生成关联规则

下面是xml文件:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<过程version = " 5.0 " >
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文








<列出关键= " data_set_meta_data_information " >



< / >列表

< /操作符>




< /操作符>






> < /过程
< /操作符>



< /操作符>


< /操作符>









> < /过程
< /操作符>
> < /过程
非常感谢你的建议。

答案

  • riddler16riddler16 成员职位:2贡献我
    嘿,

    我刚刚认识到问题不在于关联规则生成器。它是writeinto文件操作符。我只是运行相同的配置,但没有任何输出,它似乎工作。
    所以现在我在寻找任何其他的可能性来处理这个问题,因为我当然需要输出:)
    问题是,我不知道文件大小是否对操作系统或文件系统来说太大,或者文件系统需要更少的内存来保存这个文件。
    也许这里有人有什么建议可以解决这个问题?

登录注册置评。