上传者: 42122340
|
上传时间: 2021-11-04 02:58:08
|
文件大小: 7.97MB
|
文件类型: -
音频
nnAudio是使用PyTorch卷积神经网络作为后端的音频处理工具箱。 这样,可以在神经网络训练过程中从音频动态生成频谱图,并且可以训练傅立叶内核(例如CQT内核)。 也有类似的概念,他们还使用一维卷积神经网络提取基于频谱图。
其他GPU音频处理工具是和 。 但是他们没有使用神经网络方法,因此不能训练傅立叶基础。 作为PyTorch 1.6.0,torchaudio仍然很难在Windows环境下,由于在安装sox 。 由于nnAudio主要依赖PyTorch卷积神经网络,因此它是跨不同操作系统的更兼容的音频处理工具。 nnAudio的名称来自torch.nn
文献资料
与其他图书馆的比较
特征
可训练的
:check_mark_button:
:cross_mark:
:check_mark_button:
:cross_mark:
:cross_mark:
:check_mark_button:
:cross_mark:
可区分的
:check_mark_button:
:check_mark_button:
:check_mark_b