上传者: 42108948
|
上传时间: 2021-12-02 20:30:05
|
文件大小: 46KB
|
文件类型: -
D向量
这是经过GE2E损失训练的扬声器嵌入的PyTorch实现。 有关GE2E丢失的原始文章可以在这里找到:
用法
import torch
import torchaudio
wav2mel = torch . jit . load ( "wav2mel.pt" )
dvector = torch . jit . load ( "dvector.pt" ). eval ()
wav_tensor , sample_rate = torchaudio . load ( "example.wav" )
mel_tensor = wav2mel ( wav_tensor , sample_rate ) # shape: (frames, mel_dim)
emb_tensor = dvector . embed_utterance ( mel_tensor ) # shape: (emb