在过程中放置“交叉验证”操作符的地方?
在下面的客户细分过程中,我相信我已经在使用k means的集群模型中回答了使用哪个客户集群(按ID)。这就是我的问题陈述的答案。
我对在哪里放置“交叉验证”感到困惑。教程似乎表明将运算符放在“检索”数据集之后。在这一点上,RapidMiner如何验证尚未通过k均值聚类开发的模型?
任何有用的建议都非常感谢。
我对在哪里放置“交叉验证”感到困惑。教程似乎表明将运算符放在“检索”数据集之后。在这一点上,RapidMiner如何验证尚未通过k均值聚类开发的模型?
任何有用的建议都非常感谢。
标记:
0
最佳答案
-
Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽我认为问题是你所说的验证聚类模型是什么意思?验证通常意味着你有一组你知道正确答案的观察结果,这样你就可以根据已知结果检查ML算法的预测并“评分”其性能。
对于聚类(或任何无监督学习问题),事先没有已知的正确答案。您只需使用一种算法来探索数据中的结构并返回结果。您可能对任何特定算法的结果感到满意,也可能不满意,但是对于算法而言,没有客观的方法来“自我评估”其相对于其他可能的聚类解决方案的性能。
现在,在RapidMiner中有一些用于集群的性能操作符,您可能想要查看一下,您可以使用它们来帮助您理解任何特定集群解决方案的结果,并且可以使用它们来比较结果。人们也提出了不同的方法来帮助评估或比较不同的聚类结果(比如肘部法),但它仍然有点主观,没有明确的、令人信服的客观方法来说明一个聚类结果优于另一个,除非你能事先指定你要使用的确切标准是什么。5
答案
但是聚类是一个无监督的机器学习问题,在这种情况下,你没有预先定义好的标签。所以一般来说,交叉验证不适用于群集。
Lindon合资企业
乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
那么,是否还有其他方法来验证聚类模型呢?