关于聚类方法的降维作用
Muhammed_Fatih_
成员职位:93Maven
在帮助
最佳答案
-
MartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家你好,
另一种我很喜欢的方法是PCA和k均值的结合。这在很多情况下都很有意义,因为这两种算法都有相似的假设(欧几里得距离和方差通常是相同的概念)。之后你可以使用这样的技巧:https://towardsdatascience.com/understanding-clustering-cf0117148ef4去理解发生了什么。
欢呼,马丁
- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德7
答案
根据你的问题,我假设你是在谈论像PCA, ICA或其他一些与你的数据(n-grams等)相关的技术。像PCA这样的降维方法的一个主要缺点是可解释性的丧失。如果你想解释/解释,那么特征选择是保留原始特征的方法。如果你的重点是做降维,那么特征提取可以做。你可以在解释不是很重要的地方使用它。
我认为两者(提取/选择)看起来很相似,但它们有不同的目的。我不确定说特征提取比选择更好是否总是正确的。
Varun
https://www.varunmandalapu.com/
是安全的。遵循预防措施并保持社交距离
Ingo
谢谢你的文献推荐!
但是,您写道,在使用特征选择和聚类时应该小心。但是,如果您想将聚类结果解释为之后的结果,那么对于有效的降维和随后的聚类,您还有其他选择吗@varunm1提到吗?除了像LDA这样的主题建模方法之外,我没有看到任何其他方法。
提前感谢您的回答!
有趣的方法。所以你开始基于PCA值进行聚类然后尝试通过使用决策树给检测到的聚类一个意义,对吧?
最好的问候!
德国多特蒙德
Ingo