上传者: 38522214
|
上传时间: 2021-11-17 09:12:30
|
文件大小: 10.92MB
|
文件类型: -
互信息计算matlab代码计算聚类之间的调整后的相互信息
该存储库包含用于在R中的聚类之间快速且并行地计算调整后的相互信息(AMI),归一化的相互信息(NMI)和调整后的兰德指数(ARI)的代码。
NMI和ARI被广泛使用并且是成熟的分区协议度量标准。
调整后的相互信息度量标准由提出。
它提供了归一化的互信息度量,可通过计算观察到的群集大小分布的分区之间的预期互信息(EMI)来校正随机预期分区重叠的基线值,从而对其进行校正。
有关更多信息,另请参见。
原始作者提供了计算AMI值和其他功能的信息。
该存储库中的代码提供了AMI,NMI和ARI的快速,高效和可并行计算。
它用于特定的生物学应用:在将微生物宏基因组序列数据聚集成(OTU)时评估分区的一致性。
该存储库中提供的数据是针对〜1M序列的集合,根据完整链接或平均链接聚类,将其聚集成OTU。
两个分区都以每行一行(“
otu映射”)和每行一行(“
seq映射”)的格式保存;
R脚本中提供了更多详细信息。
重要的是,该代码是通用的,可用于任何类型的聚类数据。
将序列聚类到OTU中只是一个应用示例。