深度学习音频超分辨率 这是我的数据科学硕士学位论文项目。 抽象的 音频超分辨率是从低频预测给定信号缺少的高频成分的问题。 最近的一些研究表明,通过将音频超分辨率建模为回归任务,深度学习算法能够取得显着效果。 文献中已经提出了各种各样的方法,包括卷积和递归体系结构以捕获音频帧之间的局部和长期依赖性。 此外,一些研究表明,通过利用傅立叶变换操作作为神经网络配置的组成部分,不仅可以在时间上,而且可以在频域上处理输入信号,可以实现显着的改进。 本项目的目的不仅是要研究这些方法,而且要以有原则的方式将它们结合起来,以探索一种新颖的模型架构。 介绍 本文的重点是在受到一些最新技术启发的情况下,实现一种新颖的模型体系结构。 这项工作中大多数提议的方法都源于以下两项研究: 索耶·比恩鲍姆(Sawyer Birnbaum)等。 “临时电影:用特征明智的调制捕获远程序列依赖性”。 于:神经信息处理系统的进展
2022-05-24 13:33:29 137.31MB JupyterNotebook
1
用于分布和不确定性估计的混合密度网络:使用Keras(TensorFlow)进行分布和不确定性估计的通用混合密度网络(MDN)实现
1
CondenseNet-PyTorch 的PyTorch实施 目录: 项目结构: ├── agents | └── condensenet.py # the main training agent ├── graphs | └── models | | └── condensenet.py | | └── denseblock.py | | └── layers.py | └── losses | | └── loss.py # contains cross entropy loss definition ├── datasets # contains all dataloaders for the project | └── cifar10.py # dataloader for cifar10 dataset ├── data | └── cifar10
1
该文件为深度学习与卷积神经网络的matlab程序,里面包含了卷积神经网络的代码、训练程序以及结合应用的相关程序,有全套注释,适合初学卷积神经网络与深度学习的伙伴.
2022-05-23 16:32:30 53.43MB deep learning CNN matlab
1
卷积神经网络代码 Matlab deep-learning-test 深度学习导论课上的matlab实现卷积神经网络的代码,最后会有一个手写数字识别作业!
2022-05-23 15:04:46 3KB 系统开源
1
17CVPR_CODE_Learning Dynamic Guidance for Depth Image Enhancement 17 cvpr 代码
2022-05-23 12:09:08 37.6MB Deep CNN Denoiser Prior
1
WaveGAN(v2)WaveGAN的官方实现,这是一种机器学习算法,用于学习生成原始音频波形。 更新(2/2/19):为响应常见请求,我们对该存储库进行了重大改进。WaveGAN(v2)WaveGAN的正式实现,WaveGAN是一种机器学习算法,用于学习生成原始音频波形。 更新(2/2/19):为响应常见请求,我们对该存储库进行了重大改进:添加了流数据加载器,使您可以在MP3 / WAV / OGGs / etc上训练WaveGAN。 无需预处理增强了训练WaveGAN的能力,能够生成更长的音频示例(在16kHz时长达4秒)增强了对任何音频采样率的支持增强了对mul的支持
2022-05-22 20:24:40 6.53MB Python Deep Learning
1
PyTorch度量学习文档请在此处查看文档Google Colab示例请参阅示例文档文件夹,以显示带有loggin的整个培训/测试工作流程。PyTorch Metric学习文档请在此处查看文档,其中Google Colab示例请参阅示例文件夹,以显示完整的培训/测试工作流程与日志记录和模型保存。 该库的优点易于使用在培训循环中只需两行代码即可向您的应用程序添加度量学习。 通过一个功能调用即可实现矿井对和三井架。 灵活性以其他图书馆的方式混合和匹配损失,矿工和培训师
2022-05-21 22:59:01 12.91MB Python Deep Learning
1
TTAch 使用PyTorch进行图像测试时间增强! 与“数据增强”对训练集所做的类似,“测试时间增强”的目的是对测试图像进​​行随机修改。 因此,我们不会对训练后的模型仅显示一次常规的“干净”图像,而是将其多次显示。 然后,我们将平均每个对应图像的预测,并将其作为我们的最终猜测[ ]。 Input | # input batch of images / / /|\ \ \ # apply augmentations (flips, rotation, scale, etc.) | | | | | | | # pass augmented batches through model | | | | | | | # reverse transfo
1
goodbooks-10k此数据集包含一百万个最受欢迎(具有最高评分)的书籍的600万个评分。 还有:标记为由用户阅读的书籍书籍元数据(作者,年份等)标签/架子/体裁goodbooks-10k此数据集包含一百万个最受欢迎(具有最高评分)的书籍的600万个评分。 还有:被用户标记为阅读的书籍书籍元数据(作者,年份等)标签/架子/体裁访问这些文件中的一些很大,因此GitHub不会在线显示其内容。 有关较小的CSV代码段,请参见示例/。 打开笔记本以快速查看数据。 从发行版中下载单个压缩文件。 数据集可从Spotlight(推荐人)访问
2022-05-21 17:09:47 83.77MB Python Deep Learning
1