针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测;再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明。最后进行仿真验证,通过观察UCI数据集的实验结果可知,提出的算法具有较高的填补准确性。
1
为了进一步提高双聚类结果的性能,提出了一种基于变分贝叶斯的半监督双聚类算法。首先,在双聚类过程中引入了行和列的辅助信息,并提出了相应的联合分布概率模型;然后基于变分贝叶斯学习方法对联合概率分布中的参数进行估计;最后,通过合成数据集和真实的基因表达式数据集对提出的算法性能进行评估。实验表明,提出的算法在进行双聚类分析时,其归一化互信息量明显优于相关的双聚类算法。
2022-03-02 11:13:14 1.22MB 工程技术 论文
1
双聚类算法是近年来提出的一种新的聚类方法,这种算法从思想上有别于传统的聚类算法,它主要强调在聚类时基因和条件聚类的同时性。 由于它具有诸多特性,它一出现就引起了各国科学研究学者的注意,并很快成为聚类领域的一个研究热点。其中Cheng and Church 算法又是其中最重要一种算法,其它算法都是从该算法演化而来。 本文在分析Cheng and Church 算法的基础上,对该算法进行了具体的实现。 同时对原算法第二阶段扩展空间过程进行了改进。改进后,在运行时间增加不多的条件下,试验的效果有了明显的提高。 本文的另一项工作是对于双聚类算法的两个重要参数进行了初步的讨论,并对如何手工设定该参数给出了具体的建议。 最后本文使用了业界两个公认的数据集进行了实际测试,并与文献的实验效果进行了对比,结果表明,改进后的算法在时间消耗增加不多的情况下,聚类结果的质量有了较大的提高,挖掘出的表达模式更好,数据具有更强的波动一致性。 管理毕业论文网www.yifanglunwen.com 音乐毕业论文www.xyclww.com;经济论文www.youzhiessay.com 英语毕业论文www.vipvo.com教育论文www.hudonglunwen.com;医学论文网www.kuailelunwen.com;
2021-11-17 19:32:28 934B 双聚类算法 求解 matlab 毕业设计
1
基于离散时序基因表达数据的双聚类算法.pdf
2021-08-21 09:37:27 677KB 聚类 算法 数据结构 参考文献
一种求解单一簇的模糊双聚类算法.pdf
2021-08-20 14:13:34 476KB 聚类 算法 数据结构 参考文献
利用双聚类算法探测综合医学与内科学知识基础及研究前沿.pdf
2021-08-20 01:23:54 1.35MB 聚类 算法 数据结构 参考文献
双聚类算法 , 解决了传统聚类在对高维数据时遇到的瓶颈问题;文件包含了最常用的CC,FLOC,BiMax,OPSM,Plaid,SAMBA,xMOTIFs,LAS,Spectral CoClustering (Biclustering) 等多种双聚类代码,并注有代码对应的文献。
2019-12-21 22:06:58 2.99MB Biclustering 双聚类
1