“训练回归算法时的一些帮助”

manwann · 2012年6月

嗨，亲爱的快节奏社区，

我正在使用rapidminer建模来制作一个基于内容的推荐系统。为此，我下载了movielens 100K数据集，其中包含有关电影和用户对电影的评级的信息。评分范围在0到5之间，电影有类型信息(动作、喜剧等)。我正在使用拥有更多评级的用户(uid= 405;评论数= 737)，因此我将评级离散化(良好>= 3.5;bad < 3.5)，但由于用户有更多带有bad标签的评论，分类器(libSVM)将所有标签预测为bad。

然后我使用了另一种策略分层抽样(http://rapid-i.com/rapidforum/index.php/topic 2190.0.html)使类标签均匀。我得到以下结果

真坏真好类精度
pre.bad
pre.good
类回忆

MariusHelf · 2012年6月

请不要重复邮寄。讨论仍在继续在这里．

你好,陌生人!

快速链接

类别

Altair RapidMiner社区

得到帮助。学习最佳实践。与你的同事建立联系。

“训练回归算法时的一些帮助”

答案