上传者: 42117037
|
上传时间: 2022-03-18 13:35:21
|
文件大小: 12.49MB
|
文件类型: -
:warning: 结帐分支以查看pyannote.audio 2.0 中的内容:
一个更小更干净的代码库
Python-first API(不过,旧的pyannote-audio CLI 仍然可用)
多 GPU 和 TPU 训练
使用数据增强
模特主持
音频注释的食谱
基于在线
使用pyannote-audio神经说话者分类
pyannote.audio是一个用 Python 编写的用于说话人分类的开源工具包。 基于机器学习框架,它提供了一组可训练的端到端神经构建块,可以组合和联合优化来构建说话人分类管道:
pyannote.audio还带有涵盖了语音活动检测、说话人变化检测、重叠语音检测和说话人嵌入的广泛领域:
安装
pyannote.audio在 Linux 和 macOS 上仅支持 Python 3.7(或更高版本)。 它可能适用于 Windows,但没有任何保证,也没有任何计划添加对