如何填写缺失的值,基于我的数据集中的其他记录?

sebasvogsebasvog 成员职位:7新手
大家好,

我正在为一个分类问题训练ML算法做数据准备。
在我的数据集(~23000条记录)中,缺少一些值(日期)。数据集如下图所示:



每一行都是一个特定客户订单的位置。每个订单都有一个唯一的编号(a列)。发货和发票日期只显示在订单的最后一个位置。
我如何用匹配的数据填充缺失的值(基于“销售文件”)?填充的数据集应该是这样的:



我是Rapidminer的新手,如果有人能帮我解决这个问题,我会非常感激。
谢谢你!

最佳答案

    登录注册置评。