“训练回归算法时的一些帮助”

manwannmanwann 成员职位:7因素二世
2019年6月编辑 帮助
嗨,亲爱的快节奏社区,

我正在使用rapidminer建模来制作一个基于内容的推荐系统。为此,我下载了movielens 100K数据集,其中包含有关电影和用户对电影的评级的信息。评分范围在0到5之间,电影有类型信息(动作、喜剧等)。我正在使用拥有更多评级的用户(uid= 405;评论数= 737),因此我将评级离散化(良好>= 3.5;bad < 3.5),但由于用户有更多带有bad标签的评论,分类器(libSVM)将所有标签预测为bad。

然后我使用了另一种策略分层抽样(http://rapid-i.com/rapidforum/index.php/topic 2190.0.html)使类标签均匀。我得到以下结果

真坏真好类精度
pre.bad
pre.good
类回忆
标记:

答案

登录注册置评。