D向量 这是经过GE2E损失训练的扬声器嵌入的PyTorch实现。 有关GE2E丢失的原始文章可以在这里找到: 用法 import torch import torchaudio wav2mel = torch . jit . load ( "wav2mel.pt" ) dvector = torch . jit . load ( "dvector.pt" ). eval () wav_tensor , sample_rate = torchaudio . load ( "example.wav" ) mel_tensor = wav2mel ( wav_tensor , sample_rate ) # shape: (frames, mel_dim) emb_tensor = dvector . embed_utterance ( mel_tensor ) # shape: (emb
1
密集连接的时延神经网络 在我们的论文 的密集 (INTERSPEECH 2020)中,密集连接的时延神经网络(D-TDNN)的PyTorch实施。 什么是新的 :warning: [2021-02-14]我们在添加了一个impl选项,现在您可以选择: 'conv':通过F.conv1d实现TDNN。 'linear':通过F.unfold和F.linear实现TDNN。 检查此以获取更多信息。 请注意,尚未完成“ conv”的预训练模型。 [2021-02-04]此存储库中的TDNN(默认实现)比nn.Conv1d慢,但我们采用它是因为: 此仓库中的TDNN还用于创建nn.Conv1d(非对称填充)不完全支持的F-TDNN模型。 nn.Conv1d(dilation> 1,bias = True)训练缓慢。 但是,这里我们不使用F-TDNN,我们总是在D-TDNN中设置bias = F
1
关于 这是带有GUI的系统。 有关此项目的更多详细信息,请参见: 我们的 我们的 依存关系 可用于更轻松地开始该项目。 Linux,Python 2 , , , : pip install --user scikit-learn scikits.talkbox pyssp PyAudio ,通常可以由您的软件包管理器安装。 (可选) Python绑定: 安装闪电战,openblas,boost,然后: for p in bob.extension bob.blitz bob.core bob.sp bob.ap; do pip install --user $p done 注意:我们自己有一个MFCC实现,当bob不可用时,该实现将用作备用。 但是它不如bob中的C实现高效。 使用的算法 语音活动检测(VAD): (LTSD) 特点: (MFCC) (L
2021-10-10 17:47:55 25.69MB 系统开源
1
扬声器振膜仿真Acoustic Finite Element Dome/Cone Simulation Program We will verify a FINECone model compared to a real driver to see the accuracy. The FINECone model can then be used to simulate new materials, cone shapes and many other things. The actual driver is a 6.5-inch woofer in a plastic frame with a 90mm ceramic magnet and 33mm voice coil. It has a curved aluminium cone with a rubber surround and a large plastic dust cap.
2021-09-28 16:18:36 65.04MB 电声 扬声器振膜 Speaker
1
Voxceleb1数据集中的说话人验证任务 该存储库包含使用Kaldi在Voxceleb1 [1]数据集上训练i-vector说话者识别系统的简单脚本。 它是根据Kaldi / egs / sre10上的run.sh文件修改的。 要求 卡尔迪工具包 如何使用 将所有文件移至{kaldi_root} / egs / sre10文件夹 修改run.sh文件中的数据集目录和参数以适合您的计算机。 运行run.sh文件 结果 使用voxceleb1训练数据对2048个组件GMM-UBM和600维i-vector提取器进行了训练,以进行验证任务。 与Kaldi egs上的sre10基线相比,训练参数几乎相同。 GMM-2048 CDS有效值:15.39% GMM-2048 LDA + CDS eer:8.103% GMM-2048 PLDA eer:5.446% 笔记 Voxceleb1数据集是
1
X-CUBE-USB-AUDIO扩展包包括STM32F446E-EVAL和STM32F769IDISCOVERY板的库和应用示例,用作USB扬声器和录音机。 X-CUBE-USB-AUDIO扩展包可扩展;它允许为其他STM32设备和板开发USB音频应用程序。
2021-08-05 14:03:39 285.89MB STM32 USBAUDIO SPEAKER MIC
1
:robot: 梅西(Discord Self Bot) 第一个自动加入 discord selfbot - 只需一个命令即可将其加入您的服务器 :wrench: 要求 Discord 帐户令牌 Node.js v12.0.0 或更新版本 :rocket: 开始 如果您使用的是 Heroku 主机,请记住在此字段中输入令牌 git clone https://github.com/im-parsa/messi-selfbot.git cd im-parsa npm install :books: 安装 首先你需要 使用前在终端中安装npm install模块运行机器人node index.js然后使用 :red_circle: 不要忘记在index.js输入帐户令牌 :red_circle:
2021-08-04 14:05:54 52KB discord discord-bot discord-js discord-selfbot
1
说话人识别的技术汇总图书,属于综述类文章的汇集成册
2021-05-04 16:43:05 16.4MB 说话人识别
1
英文版本,对语音识别技术的现有情况地总结和描述了对未来的展望。
2021-05-04 16:23:26 757KB recognition
1