预测缺失值

hatsjikideehatsjikidee 成员职位:3.新手
2019年10月编辑 帮助
你好所有的,

我有一个数据集,里面有大约3000首被评级的歌曲。大约有一半被评分,另一半没有。我正在尝试建立一个模型,根据用户的评分来预测空的评分。我做了以下几点:

我的问题是,这是正确的吗?我需要做些调整使它更正确吗?因为当我改变k时,我得到不同的值。还有一个问题:我如何只显示已经预测的值,而不是完整的概述,包括已经填充的值。

提前谢谢!

最佳答案

答案

  • lionelderkrikorlionelderkrikor 主持人,RapidMiner认证分析师,会员职位:1195年独角兽
    @hatsjikidee

    如果你对你的歌曲有一些描述性的特征,你可以基于你的标记数据(你的评级歌曲)建立一个模型,然后将这个模型应用到未标记的数据(未评级的歌曲)。

    为了进一步帮助你,你能分享你的数据吗?

    希望这能有所帮助,

    问候,

    莱昂内尔

  • hatsjikideehatsjikidee 成员职位:3.新手
    嗨,莱昂内尔,

    数据集有3个属性:
    歌曲名称-评分-(评分者姓名)

    每个用户大约有40首歌,其中20首有评级,20首没有。所以我们的目标是根据用户对已经评分的内容来预测缺失的内容。希望这能给你更多的解释。
  • hatsjikideehatsjikidee 成员职位:3.新手
    所以据我所知,只要有可能,我就能通过这个过程做出正确的预测。谢谢你们两位的帮助和信息!
    Tghadially
登录注册置评。