如何用最频繁的值来推算缺失的数据

糟糕糟糕 成员职位:2贡献我
2021年12月编辑 帮助
我有一个包含分类和数值数据的数据集,我想知道如何用频繁值计算缺失的数据。
例如
ID Feature1特性2特性3
_______________________________________
123 core i7 Windows 33844690
334 IOS手机99983648

注意,丢失的值很大,但我不能删除列。
是否有一个操作符可以用来将标称数据替换为模式?数值数据是平均值还是最大值?
标记:

最佳答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3316年RM数据科学家
    解决方案接受
    你好,
    您可以使用替换缺失值。Average实际上采用标称列的模式。

    欢呼,
    马丁
    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    登录注册置评。