存在缺失值的FPGrowth算法

zazass8zazass8 成员职位:1学我
我试图在已经二值化的数据集上实现fpgrowth算法,但也包含一些缺失的值。我认为,与其应用数据代入技术,不如找到一种方法,通过忽略缺失值来计算支持度和置信度度量。例如,如果对于项目A,我在10个交易中有4个出现,其中2个丢失,那么支持应该是4/8而不是4/10。我们将对所有项目集都这样做。我试图从mlextend库编辑fpgrowth算法的开源代码,但我发现这很难做到,代码通常非常抽象。有人找到解决这个问题的方法了吗?我知道@MattTC13几年前在这个论坛上提出了完全相同的问题,如果你有一个解决方案,那将是伟大的你分享它!
    登录注册置评。