Fp-growth规则和关联规则无法运行
你好,
我使用快速矿工文本挖掘功能对文本文件中的单词进行聚类分析。
我按照Rapidminer文本挖掘教程的说明,程序可以运行。然而,它没有给出任何结果。没有发现结果?
你能帮我解决这个“无输出”的问题吗?
最好的问候,
钱
这是我使用的模型:设置(数值为二项)min=0,max=1。(fp-growth)最大条目=-1,最小条目=15,最大条目=100
0
0评论 | 0的讨论 | 0成员 | 0在线 |
你好,
我使用快速矿工文本挖掘功能对文本文件中的单词进行聚类分析。
我按照Rapidminer文本挖掘教程的说明,程序可以运行。然而,它没有给出任何结果。没有发现结果?
你能帮我解决这个“无输出”的问题吗?
最好的问候,
钱
这是我使用的模型:设置(数值为二项)min=0,max=1。(fp-growth)最大条目=-1,最小条目=15,最大条目=100
答案
嗨,陈,
是您的FP-Growth上的断点导致了您的麻烦吗?如果不是这样,我会检查FP-Growth上的最小支持参数。降低到0.1,然后再试一次。
你好托马斯,
谢谢你的建议,我将min_support更改为0.05,但是在FP-Growth中仍然没有找到任何项,所以没有关联规则。我还将向量创建更改为术语出现,TF-IDF和术语频率,它们都产生“没有找到项目”。不知道是不是因为文件本身的问题。你能帮我检查一下这些文件在你的程序中是否运行正常(请见附件txt)吗?文件)?
最好的问候,
钱
zip文件无效,我无法d/l。
你好托马斯,
如果你有时间检查我的挖矿过程,也请检查附件中的rapidminer文件(rmp和property)。
谢谢和问候。
钱
你好托马斯,
感谢您的及时回复。你能再检查一下附件中的文件吗?
最好的问候,
钱
因此,您发送的word doc将只生成一个示例行,这将不适用于您想要做的事情。要么提供更多文档来增加示例行,要么使用Cut操作符将一个文档分割成多个部分。这就是为什么它没有产生任何结果
你好托马斯,
谢谢你的建议,终于解决了。然而,有点奇怪的是,我必须使用高值(例如,0.95)的fp增长,而不是0.05,以便获得结果。如果我使用较小的Minvalue,它仍然不会产生fp增长结果。你能帮我解释一下为什么它是反过来的吗?
最好的问候,
钱
你好托马斯,
顺便说一下,我还尝试了不同的文件进行处理,但是,并不是每次都有成功的运行。当我第一次处理20个文件时,它的fp-growth最小值为0.95。然后我试图将文件数量减少到只有3个,它可以在相同的设置下运行,但像无限期运行(超过3小时),我不知道是否需要停止它。我不知道为什么更少的文件需要更多的时间来运行,或者他们甚至没有产生任何结果。你能给我一些关于这个现象的建议吗?
最好的问候,
钱
我也不知道为什么会这样。你对文本处理做了什么改变吗?你能在进入FP-Growth之前比较这两个结果吗?
W.R.T到最小值,不确定那里发生了什么,但较小的最小值应该使项目集构建得更快。您的过程听起来有些奇怪,我会通过使用断点仔细检查操作符之间的数据流
你好托马斯,
谢谢你的建议。我对不同的文件集使用了相同的进程和操作符,仍然出现了不定式运行的问题。但是,我将通过试验和错误检查断点和不同参数值的组合,以查看是否存在此问题的任何模式。如果我有新的发现,我会写信给你。
最好的问候,
钱
请教我RapidMiner中fp-growth和apriori的比较方法测试结果?