近年来,深度学习彻底改变了许多机器学习任务,从图像分类和视频处理到语音识别和自然语言理解。这些任务中的数据通常在欧几里得空间中表示。 然而,越来越多的应用程序从非欧几里得域中生成数据,并表示为对象之间具有复杂关系和相互依赖性的图形。图数据的复杂性给现有的机器学习算法带来了重大挑战。最近,出现了许多关于扩展图数据深度学习方法的研究。在本次调查中,我们全面概述了数据挖掘和机器学习领域的图神经网络 (GNN)。我们提出了一种新的分类法,将最先进的图神经网络分为四类,即循环图神经网络、卷积图神经网络、图自动编码器和时空图神经网络。我们进一步讨论了图神经网络在各个领域的应用,并总结了图神经网络的开源代码、基准数据集和模型评估。最后,我们提出了这个快速发展领域的潜在研究方向。
1
图神经网络 (GNN) 已成为分析和学习图数据的标准工具包。随着该领域的发展,识别关键架构并验证可推广到更大、更复杂的数据集的新想法变得至关重要。不幸的是,在缺乏具有一致实验设置的标准化基准的情况下,越来越难以衡量新模型的有效性。在本文中,我们介绍了一个可重复的 GNN 基准测试框架,使研究人员能够方便地为任意数据集添加新模型。我们通过对最近的 Weisfeiler-Lehman GNN (WL-GNN) 与基于消息传递的图卷积网络 (GCN) 进行各种图任务(即图回归/分类和节点/链路预测,具有中等规模的数据集。
2021-08-26 09:12:01 1.6MB 图神经网络 OBG 图嵌入表示
1
SEGAN:语音增强生成对抗网络 介绍 这是SEGAN项目的存储库。 我们的原始文件可以在找到,并且测试样本可以。 在这项工作中,采用了一种对抗性生成方法,以一种完全卷积的体系结构来进行语音增强(即从损坏的语音信号中去除噪声),如下所示: 该模型处理处于不同SNR的许多噪声条件下的原始语音波形(训练时为40,测试时为20)。 它还可以对来自混合在同一结构中的许多说话者的语音特征进行建模(无需任何身份监督),这使得生成的结构在噪声和说话者维度上具有普遍性。 所有项目都是使用TensorFlow开发的。 关于GAN的定义和部署,有两个很好的参考资料库: GAN:实施改进以更稳定的方式训练G
1
适用于Windows和Linux的Yolo v4,v3和v2 (用于物体检测的神经网络) 纸YOLO v4: : Paper Scaled : : 用于重现结果: 有关媒体的文章中的更多详细信息: 手册: : 讨论: 关于Darknet框架: : 如何在Linux上编译 如何在Windows上编译 AP50:95-FPS(Tesla V100)论文: : AP50:95 / AP50-FPS(Tesla V100)论文: : tkDNN-TensorRT将批次1的YOLOv4加速约2倍,将批次4的YOLOv4加速3倍至4倍。 tkDNN: : Op
1
让彩色!:灰度图像的自动着色 概述 这段代码使用Tensorflow在python中提供了的实现: "Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification" Satoshi Iizuka, Edgar Simo-Serra, and Hiroshi Ishikawa ACM Transaction on Graphics (Proc. of SIGGRAPH 2016), 2016 本文提供了一种使用深层网络自动为灰度图像着色的方法。 该网络在单个框架中共同学习局部特征和全局特征,然后可以将其用于任何分辨率的图像上。 通过合并全局特征,可以使用
1
Recurrent neural networks are popular tools used for modeling time series. Common gradient-based algorithms are frequently used for training recur- rent neural networks. On the other side approaches based on the Kalman filtration are considered to be the most appropriate general-purpose training algorithms with respect to the modeling accuracy.
2021-08-23 00:59:10 6.13MB RNN; KF
1
基于卷积神经网络的语音活动检测器 该GitHub存储库是以下论文的代码伴奏: 用于实时语音活动检测的卷积神经网络智能手机应用程序Abhishek Sehgal和Nasser Kehtarnavaz-达拉斯德克萨斯大学 摘要:本文提出了一种智能手机应用程序,该应用程序基于卷积神经网络执行实时语音活动检测。 讨论了实时实现问题,这些问题显示了如何解决与卷积神经网络相关的缓慢推理时间。 开发的智能手机应用旨在充当助听器信号处理管道中降噪的开关,从而能够在嘈杂的语音信号的仅噪声部分进行噪声估计或分类。 将开发的智能手机应用程序与以前开发的语音活动检测应用程序以及两种被引用率很高的语音活动检测算法进行比较。 实验结果表明,使用卷积神经网络开发的应用程序优于以前开发的智能手机应用程序。 资源 可通过以下链接获得与该工作有关的支持材料: 关联 描述 IEEE访问手稿 在Android和iOS智
1
焦点损失 降低了分类良好的示例的权重。 这样做的净效果是,将更多的培训重点放在难以分类的数据上。 在我们的数据不平衡的实际环境中,由于我们拥有更多的数据,我们的多数阶级将很快得到很好的分类。 因此,为了确保我们在少数族裔班上也能达到很高的准确性,我们可以使用焦点损失在训练过程中为那些少数族裔班级提供更多的相对权重。 焦点损失可以很容易地在Keras中实现为自定义损失函数。 用法 以焦点损失为样本编译模型: 二进位 model.compile(损失= [binary_focal_loss(alpha = .25,gamma = 2)],指标= [“准确性”],优化程序= adam) 分类的 model.compile(损失= [categoical_focal_loss(alpha = [[。25,.25,.25]],gamma = 2)],指标= [“准确性”],优化程序= ad
1
Michael Nielsen 大神的 《Neural Networks and Deep Learning》中文+英文+Python3代码,Michael Nielsen 大神的 《Neural Networks and Deep Learning》中文+英文+Python3代码
2021-08-17 10:33:37 33.98MB 神经网络 深度学习
1