Fp-growth规则和关联规则无法运行

陈 成员职位:7贡献我
2018年11月编辑 帮助

你好,

我使用快速矿工文本挖掘功能对文本文件中的单词进行聚类分析。

我按照Rapidminer文本挖掘教程的说明,程序可以运行。然而,它没有给出任何结果。没有发现结果?

你能帮我解决这个“无输出”的问题吗?

最好的问候,

这是我使用的模型:设置(数值为二项)min=0,max=1。(fp-growth)最大条目=-1,最小条目=15,最大条目=100

Capture.JPG

答案

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽

    嗨,陈,

    是您的FP-Growth上的断点导致了您的麻烦吗?如果不是这样,我会检查FP-Growth上的最小支持参数。降低到0.1,然后再试一次。

  • 陈 成员职位:7贡献我

    你好托马斯,

    谢谢你的建议,我将min_support更改为0.05,但是在FP-Growth中仍然没有找到任何项,所以没有关联规则。我还将向量创建更改为术语出现,TF-IDF和术语频率,它们都产生“没有找到项目”。不知道是不是因为文件本身的问题。你能帮我检查一下这些文件在你的程序中是否运行正常(请见附件txt)吗?文件)?

    最好的问候,

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽

    zip文件无效,我无法d/l。

  • 陈 成员职位:7贡献我

    你好托马斯,

    如果你有时间检查我的挖矿过程,也请检查附件中的rapidminer文件(rmp和property)。

    谢谢和问候。

  • 陈 成员职位:7贡献我

    你好托马斯,

    感谢您的及时回复。你能再检查一下附件中的文件吗?

    最好的问候,

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽

    因此,您发送的word doc将只生成一个示例行,这将不适用于您想要做的事情。要么提供更多文档来增加示例行,要么使用Cut操作符将一个文档分割成多个部分。这就是为什么它没有产生任何结果

  • 陈 成员职位:7贡献我

    你好托马斯,

    谢谢你的建议,终于解决了。然而,有点奇怪的是,我必须使用高值(例如,0.95)的fp增长,而不是0.05,以便获得结果。如果我使用较小的Minvalue,它仍然不会产生fp增长结果。你能帮我解释一下为什么它是反过来的吗?

    最好的问候,

  • 陈 成员职位:7贡献我

    你好托马斯,

    顺便说一下,我还尝试了不同的文件进行处理,但是,并不是每次都有成功的运行。当我第一次处理20个文件时,它的fp-growth最小值为0.95。然后我试图将文件数量减少到只有3个,它可以在相同的设置下运行,但像无限期运行(超过3小时),我不知道是否需要停止它。我不知道为什么更少的文件需要更多的时间来运行,或者他们甚至没有产生任何结果。你能给我一些关于这个现象的建议吗?

    最好的问候,

  • Thomas_OttThomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽

    我也不知道为什么会这样。你对文本处理做了什么改变吗?你能在进入FP-Growth之前比较这两个结果吗?

    W.R.T到最小值,不确定那里发生了什么,但较小的最小值应该使项目集构建得更快。您的过程听起来有些奇怪,我会通过使用断点仔细检查操作符之间的数据流

  • 陈 成员职位:7贡献我

    你好托马斯,

    谢谢你的建议。我对不同的文件集使用了相同的进程和操作符,仍然出现了不定式运行的问题。但是,我将通过试验和错误检查断点和不同参数值的组合,以查看是否存在此问题的任何模式。如果我有新的发现,我会写信给你。

    最好的问候,

  • newsinteriordesnewsinteriordes 成员职位:1贡献我

    请教我RapidMiner中fp-growth和apriori的比较方法测试结果?

登录注册置评。