用其他属性(项目标识符)的平均值/平均值替换缺失的权重值

FrancisCFrancisC 成员职位:2新手
你好,

我有一个包含超市数据的数据集,我的两个属性是商品权重和商品标识符。
很多例子都缺少重量信息,但由于项目标识符,我知道它们必须是什么(见图:DRA24必须是19.350,DRA59必须是8.270)

如何根据项目标识符属性的平均值或平均值替换缺失的权重值?
或者是否有其他方法可以修复缺失的权重值?

答案

  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3302年RM数据科学家
    @FrancisC
    我会像这样使用Group Into Collection:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.8.000”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文







    <过程扩展= " true " >




    <列出关键= " function_descriptions " >


    < / >列表

    <列出关键= " numeric_series_configuration " / >
    <列出关键= " date_series_configuration " / >







    < /操作符>




    每个item_id获取一个示例集
    < /操作符>





    <过程扩展= " true " >
















    <列出关键= "列" / >
    < /操作符>





    > < /过程
    < /操作符>






    > < /过程
    < /操作符>
    > < /过程


    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
    lionelderkrikor
  • FrancisCFrancisC 成员职位:2新手
    非常感谢!不幸的是,我不知道如何写代码。有没有一个操作符可以做同样的事情?
  • MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3302年RM数据科学家
    @FrancisC
    这是一个过程。请检查https://community.www.turtlecreekpls.com/discussion/32606/import-xml-code-to-process如何让XML进入你的RapidMiner。

    最好的
    马丁

    - RapidMin乐鱼平台进入er数据科学服务主管
    德国多特蒙德
登录注册置评。