用于图分类的基准图数据集的存储库
图分类简介
近年来,目睹了涉及具有结构关系的对象的越来越多的应用,包括生物信息学中的化合物,大脑网络,图像结构和学术引用网络。 对于这些应用程序,图形是用于建模和捕获对象之间的依赖关系的自然而强大的工具。
与传统数据不同,在传统数据中,每个实例均以特征值矢量格式表示,图具有节点-边缘结构关系,并且没有自然矢量表示。 近年来,这一挑战激发了许多图分类算法。 给定一组训练图,每个训练图与一个类别标签相关联,图分类旨在从训练图中学习模型,以预测将来看不到的图。 下图显示了矢量数据和图形数据之间的betweeb分类差异。
数据集汇总
该存储库维护31个基准图数据集,这些数据集广泛用于图分类。 图形数据集包括:
化学化合物
引文网络
社交网络
脑网络
化学化合物图形数据集采用“ .sdf”或“ .smi”格式,其他图形数据集则表示为“ .nel”格式。 所有这些
1