针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测;再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明。最后进行仿真验证,通过观察UCI数据集的实验结果可知,提出的算法具有较高的填补准确性。
1
GAIN的tensorflow版本,包括GAIN、SGAIN、WSGAIN-CP、WSGAIN-GP,包含十个数据集和四种缺失数据填补方法,关于GAIN的pytorch版本,可以参考资源:https://download.csdn.net/download/didi_ya/85864128
2022-07-02 21:05:11 6.72MB 生成器 神经网络 tensorflow python
GAIN的pytorch版本,包括GAIN、SGAIN、WSGAIN-CP、WSGAIN-GP,包含十个数据集和四种缺失数据填补方法,关于GAIN的tensorflow版本,可以参考资源:https://download.csdn.net/download/didi_ya/85864095
2022-07-02 21:05:11 6.72MB pytorch python 生成器 神经网络
基于生成对抗网络的Spambase DataSet数据集缺失数据填补源码实现(python).py,详情可参考文章:https://wendy.blog.csdn.net/article/details/125072344(GAIN),利用pytorch实现
2022-06-02 21:05:17 331KB pytorch python 生成对抗网络 神经网络
1
基于不完备数据聚类的缺失数据填补方法
2022-05-06 14:06:16 15KB 文档资料 聚类 数据挖掘 机器学习
书名《Applied Missing Data Analysis》应用缺失数据分析,英文版,带目录书签,高清版。
2021-11-23 11:17:42 5.3MB 数据填补 大数据 分析
1