图上的深度学习最近引起了人们的极大兴趣。然而,大多数工作都集中在(半)监督学习上,导致存在标签依赖重、泛化能力差和鲁棒性弱等缺点。为了解决这些问题,自监督学习 (SSL) 通过精心设计的借口任务提取信息知识,而不依赖于手动标签,已成为图数据的一种有前途和趋势的学习范式。与计算机视觉和自然语言处理等其他领域中的 SSL 不同,图上的 SSL 具有独特的背景、设计思想和分类法。在图自监督学习的框架下,我们及时全面地回顾了使用SSL技术处理图数据的现有方法。我们构建了一个统一的框架,在数学上形式化了图 SSL 的范式。根据借口任务的目标,我们将这些方法分为四类:基于生成的方法、基于辅助属性的方法、基于对比的方法和混合方法。我们进一步总结了图 SSL 在各个研究领域的应用,并总结了图 SSL 的常用数据集、评估基准、性能比较和开源代码。最后,我们讨论了该研究领域的剩余挑战和潜在的未来方向。
2021-09-02 19:06:45 3.13MB 图神经网络 自监督学习 图表示学习
1
图的机器学习在学术界和工业界都得到了广泛的研究。然而,随着大量新兴方法和技术的出现,关于图形学习的文献蓬勃发展,为不同的图形相关任务手动设计最优机器学习算法变得越来越困难。为了解决这一关键挑战,图上的自动机器学习(AutoML)将图机器学习和AutoML的优点结合在一起,正受到研究界的关注。因此,本文对图自动建模进行了全面的研究,主要研究了图机器学习的超参数优化(HPO)和神经结构搜索(NAS)。我们进一步概述了与自动图形机器学习相关的库,并深入讨论了AutoGL,这是第一个针对图形的AutoML的专用开源库。最后,我们分享了我们对自动化图机器学习未来研究方向的见解。本文是我们所知的第一篇关于图自动机器学习的系统和全面的综述。
1
Graph Neural Networks: Methods, Applications, and Opportunities 在过去十年左右的时间里,我们见证了深度学习重振机器学习领域。它以最先进的性能解决了计算机视觉、语音识别、自然语言处理和各种其他任务领域的许多问题。数据通常在这些域中的欧几里得空间中表示。各种其他域符合非欧几里得空间,图是其中的理想表示。图适用于表示各种实体之间的依赖关系和相互关系。传统上,图形的手工特征无法从这种复杂的数据表示中为各种任务提供必要的推理。最近,出现了利用深度学习中的各种进步来绘制基于数据的任务的趋势。本文对每个学习设置中的图神经网络 (GNN) 进行了全面调查:监督学习、无监督学习、半监督学习和自监督学习。每个基于图的学习设置的分类都提供了属于给定学习设置的方法的逻辑划分。从理论和经验的角度分析每个学习任务的方法。此外,我们提供了构建 GNN 的通用架构指南。还提供了各种应用程序和基准数据集,以及仍然困扰 GNN 普遍适用性的开放挑战。
1
Heterogeneous Network Representation Learning: A Unified Framework with Survey and Benchmark 由于现实世界中的对象及其交互通常是多模态和多类型的,因此异构网络被广泛用作传统同构网络(图)的更强大、更真实和更通用的超类。同时,表征学习(又称嵌入)最近得到了广泛的研究,并被证明对各种网络挖掘和分析任务是有效的。在这项工作中,我们的目标是提供一个统一的框架,以深入总结和评估现有的异构网络嵌入(HNE)研究,包括但不限于一般的调查。由于已经有了大量的HNE算法,作为这项工作的第一个贡献,我们提供了一个通用的范例,用于系统地分类和分析各种现有HNE算法的优点。此外,现有的HNE算法虽然大多声称是通用的,但通常在不同的数据集上进行评估。由于HNE的应用优势,这种间接比较在很大程度上阻碍了将改进的任务性能正确地归因于有效的数据预处理和新颖的技术设计,特别是考虑到从实际应用数据构建异构网络的各种可能方式。因此,作为第二项贡献,我们从不同来源创建了四个基准数据集,这些数据集具有关于规模、结构、属性/标签可用性等的各种属性,以方便和公平地评估HNE算法。作为第三个贡献,我们仔细地重构和修改了实现,为13种流行的HNE算法创建了友好的界面,并在多个任务和实验设置中对它们进行了全面的比较。
1
表征学习为各种人工智能领域提供了一种革命性的学习范式。在本次调查中,我们研究和回顾了表征学习的问题,重点是由不同类型的顶点和关系组成的异构网络。这个问题的目标是自动将输入异构网络中的对象(最常见的是顶点)投影到潜在的嵌入空间中,这样网络的结构和关系属性都可以被编码和保留。然后可以将嵌入(表示)用作机器学习算法的特征,以解决相应的网络任务。为了学习表达性嵌入,当前的研究进展可以分为两大类:浅层嵌入学习和图神经网络。在对现有文献进行彻底审查后,我们确定了几个尚未解决的关键挑战,并讨论了未来的方向。最后,我们构建了异构图基准以促进对这个快速发展的主题的开放研究。
1
许多学习任务需要处理包含丰富元素之间关系信息的图形数据。物理系统建模、学习分子指纹、预测蛋白质界面和疾病分类需要一个模型来从图形输入中学习。在其他领域,例如从文本和图像等非结构数据中学习,对提取的结构(如句子的依赖树和图像的场景图)进行推理是一个重要的研究课题,也需要图推理模型。图神经网络 (GNN) 是神经模型,它通过图节点之间的消息传递来捕获图的依赖性。近年来,图卷积网络 (GCN)、图注意力网络 (GAT)、图循环网络 (GRN) 等 GNN 的变体在许多深度学习任务上都表现出了突破性的表现。在本次调查中,我们为 GNN 模型提出了一个通用的设计流程,并讨论了每个组件的变体,系统地对应用程序进行了分类,并为未来的研究提出了四个开放性问题。
1
A Survey on Heterogeneous Graph Embedding: Methods, Techniques, Applications and Sources 异构图 (HG) 也称为异构信息网络,在现实世界中无处不在;因此,HG 嵌入旨在在低维空间中学习表示,同时保留下游任务(例如,节点/图分类、节点聚类、链接预测)的异构结构和语义,近年来引起了相当大的关注。在本次调查中,我们对 HG 嵌入方法和技术的最新发展进行了全面审查。我们首先介绍了 HG 的基本概念,并讨论了与同构图表示学习相比,HG 嵌入的异质性带来的独特挑战;然后我们根据他们在学习过程中使用的信息系统地调查和分类最先进的 HG 嵌入方法,以解决 HG 异质性带来的挑战。特别是对于每一种有代表性的HG嵌入方法,我们都进行了详细的介绍,并进一步分析了其优缺点;同时,我们还首次探索了不同类型的 HG 嵌入方法在现实工业环境中的变革性和适用性。此外,我们进一步介绍了几个广泛部署的系统,这些系统已经证明了 HG 嵌入技术在解决具有更广泛影响的实际应用问题方面的成功。为了促进该领域的未来研究和应用,我们还总结了开源代码、现有图学习平台和基准数据集。最后,我们探讨了 HG 嵌入的其他问题和挑战,并预测了该领域的未来研究方向。
1
Foundations and modelling of dynamic networks using Dynamic Graph Neural Networks: A survey 动态网络用于广泛的领域,包括社交网络分析、推荐系统和流行病学。将复杂网络表示为随时间变化的结构,网络模型不仅可以利用结构模式,还可以利用时间模式。然而,由于动态网络文学来自不同领域并使用不一致的术语,因此导航具有挑战性。同时,图神经网络 (GNN) 近年来因其在一系列网络科学任务(例如链接预测和节点分类)上表现出色的能力而受到广泛关注。尽管图神经网络很流行并且动态网络模型的好处已经得到证实,但很少有人关注用于动态网络的图神经网络。为了解决这项研究跨越不同领域以及调查动态图神经网络这一事实所带来的挑战,这项工作分为两个主要部分。首先,为了解决动态网络术语的歧义,我们建立了具有一致、详细的术语和符号的动态网络基础。其次,我们使用所提出的术语对动态图神经网络模型进行了全面调查。
1
Bridging the Gap between Spatial and Spectral Domains:A Survey on Graph Neural Networks 深度学习的成功在各种机器学习任务中得到了广泛认可,包括图像分类、音频识别和自然语言处理。作为深度学习在这些领域之外的扩展,图神经网络 (GNN) 旨在处理以前的深度学习技术难以处理的非欧图结构。现有的 GNN 使用各种技术呈现,这使得直接比较和交叉引用更加复杂。尽管现有研究将 GNN 分为基于空间和基于光谱的技术,但尚未对它们的关系进行彻底检查。为了弥补这一差距,本研究提出了一个系统地整合了大多数 GNN 的单一框架。我们将现有的 GNN 组织到空间和光谱域中,并暴露每个域内的连接。谱图理论和近似理论的回顾在进一步研究中建立了跨空间和谱域的强关系。
1
近年来,深度学习彻底改变了许多机器学习任务,从图像分类和视频处理到语音识别和自然语言理解。这些任务中的数据通常在欧几里得空间中表示。 然而,越来越多的应用程序从非欧几里得域中生成数据,并表示为对象之间具有复杂关系和相互依赖性的图形。图数据的复杂性给现有的机器学习算法带来了重大挑战。最近,出现了许多关于扩展图数据深度学习方法的研究。在本次调查中,我们全面概述了数据挖掘和机器学习领域的图神经网络 (GNN)。我们提出了一种新的分类法,将最先进的图神经网络分为四类,即循环图神经网络、卷积图神经网络、图自动编码器和时空图神经网络。我们进一步讨论了图神经网络在各个领域的应用,并总结了图神经网络的开源代码、基准数据集和模型评估。最后,我们提出了这个快速发展领域的潜在研究方向。
1