Fp-growth规则和关联规则无法运行

陈 · 2017年5月

你好,

我使用快速矿工文本挖掘功能对文本文件中的单词进行聚类分析。

我按照Rapidminer文本挖掘教程的说明，程序可以运行。然而，它没有给出任何结果。没有发现结果?

你能帮我解决这个“无输出”的问题吗?

最好的问候,

钱

这是我使用的模型:设置(数值为二项)min=0,max=1。(fp-growth)最大条目=-1，最小条目=15，最大条目=100

Thomas_Ott · 2017年5月

嗨,陈,

是您的FP-Growth上的断点导致了您的麻烦吗?如果不是这样，我会检查FP-Growth上的最小支持参数。降低到0.1，然后再试一次。

陈 · 2017年5月

你好托马斯,

谢谢你的建议，我将min_support更改为0.05，但是在FP-Growth中仍然没有找到任何项，所以没有关联规则。我还将向量创建更改为术语出现，TF-IDF和术语频率，它们都产生“没有找到项目”。不知道是不是因为文件本身的问题。你能帮我检查一下这些文件在你的程序中是否运行正常(请见附件txt)吗?文件)?

最好的问候,

钱

Thomas_Ott · 2017年5月

zip文件无效，我无法d/l。

陈 · 2017年5月

你好托马斯,

如果你有时间检查我的挖矿过程，也请检查附件中的rapidminer文件(rmp和property)。

谢谢和问候。

钱

陈 · 2017年5月

你好托马斯,

感谢您的及时回复。你能再检查一下附件中的文件吗?

最好的问候,

钱

Thomas_Ott · 2017年5月

因此，您发送的word doc将只生成一个示例行，这将不适用于您想要做的事情。要么提供更多文档来增加示例行，要么使用Cut操作符将一个文档分割成多个部分。这就是为什么它没有产生任何结果

陈 · 2017年5月

你好托马斯,

谢谢你的建议，终于解决了。然而，有点奇怪的是，我必须使用高值(例如，0.95)的fp增长，而不是0.05，以便获得结果。如果我使用较小的Minvalue，它仍然不会产生fp增长结果。你能帮我解释一下为什么它是反过来的吗?

最好的问候,

钱

陈 · 2017年5月

你好托马斯,

顺便说一下，我还尝试了不同的文件进行处理，但是，并不是每次都有成功的运行。当我第一次处理20个文件时，它的fp-growth最小值为0.95。然后我试图将文件数量减少到只有3个，它可以在相同的设置下运行，但像无限期运行(超过3小时)，我不知道是否需要停止它。我不知道为什么更少的文件需要更多的时间来运行，或者他们甚至没有产生任何结果。你能给我一些关于这个现象的建议吗?

最好的问候,

钱

Thomas_Ott · 2017年5月

我也不知道为什么会这样。你对文本处理做了什么改变吗?你能在进入FP-Growth之前比较这两个结果吗?

W.R.T到最小值，不确定那里发生了什么，但较小的最小值应该使项目集构建得更快。您的过程听起来有些奇怪，我会通过使用断点仔细检查操作符之间的数据流

陈 · 2017年5月

你好托马斯,

谢谢你的建议。我对不同的文件集使用了相同的进程和操作符，仍然出现了不定式运行的问题。但是，我将通过试验和错误检查断点和不同参数值的组合，以查看是否存在此问题的任何模式。如果我有新的发现，我会写信给你。

最好的问候,

钱

newsinteriordes · 2017年8月

请教我RapidMiner中fp-growth和apriori的比较方法测试结果?

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

Fp-growth规则和关联规则无法运行

答案