帮助使用朴素贝叶斯
你好男人
我需要帮助。我得到了一个任务,我必须用朴素贝叶斯算法预测y的值。我必须使用的数据非常大,复杂,对我来说没有太大的意义。我把它们放在“火车”文件下。“Xo”~“X8”为字母形式,其他为二进制形式。正常值只有“y”。值“y”我把标称值(因为贝叶斯),并标记它。我还把流程归档了。我看了很多教程,但我认为问题出在我的数据上。我知道我需要删除一些不相关的数据,但就我的知识和目前的技能而言,这些数据太多了。 In performance I got 0.32% accuracy. Can u please look at my Rapidminer program and train files and tell me what to do and how? Or maybe this isn´t the right algorythm for my problem, thats also an option.
非常感谢
我需要帮助。我得到了一个任务,我必须用朴素贝叶斯算法预测y的值。我必须使用的数据非常大,复杂,对我来说没有太大的意义。我把它们放在“火车”文件下。“Xo”~“X8”为字母形式,其他为二进制形式。正常值只有“y”。值“y”我把标称值(因为贝叶斯),并标记它。我还把流程归档了。我看了很多教程,但我认为问题出在我的数据上。我知道我需要删除一些不相关的数据,但就我的知识和目前的技能而言,这些数据太多了。 In performance I got 0.32% accuracy. Can u please look at my Rapidminer program and train files and tell me what to do and how? Or maybe this isn´t the right algorythm for my problem, thats also an option.
非常感谢
标记:
0
最佳答案
-
lionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1194年独角兽嗨@yoak95,
1/你的标签有实值并且是连续的:因此,在我看来,你有一个回归问题而不是分类问题。因此不能使用朴素贝叶斯模型。
首先,我删除了您的前八个属性(以字母作为值的属性),并将您的数据提交给Auto-Model:实际上,您有很多不相关的属性:Auto-Model在构建过程之前从数据集中检测并自动删除这些不相关的属性。
通过这些方法,我得到了比较好的结果:在6%的相对误差.
在附件中,其中一个过程建立了自动模型(GLM模型)。
2/如果你想绝对使用朴素贝叶斯模型,你必须将你的回归问题转化为分类问题:
我为你的标签“y”创建了四个大小相等的类。您可以在Auto-Model的“准备目标”屏幕上执行此操作。
在训练朴素贝叶斯模型后,我获得了47%的准确率。
请随意尝试不同数量的课程……
您可以在附件中找到使用Auto-Model构建的朴素贝叶斯模型的分类过程。
希望这能帮到你,
问候,
莱昂内尔
5
答案