LPC_for_TTS 基于Levinson-Durbin算法的Python中的梅尔谱图的线性预测系数估计。 基于Levinson-Durbin归纳法来做线性预测系数的估计。 from audio import * import numpy as np from hparams import Hparams as hparams input_wav_file = 'test.wav' sample_rate = 24000 lpc_order = 8 orig_audio , pred_audio , residual , lpcs = lpc_audio ( input_wav_file , lpc_order , hparams ) save_wav ( pred_audio , 'wavs/pred.wav' , hparams ) save_wav ( orig_audio ,
2022-01-04 15:11:21 667KB tts lpc vocoder mel-spectrogram
1
这是描述的FFTNet的pytorch实现。工作正在进行中。 快速开始 安装要求 pip install -r requirements.txt 下载数据集。 训练模型并保存。默认参数与int原始纸张几乎相同。第一次执行时升起--preprocess标志。 python train.py \ --preprocess \ --wav_dir your_downloaded_wav_dir \ --data_dir preprocessed_feature_dir \ --model_file saved_model_name \ 使用训练有素的模型从mcc功能解码/重构wav文件。 python decode.py \ --infile wav_file --outfile reconstruct_file_name --data
2021-10-11 15:32:21 454KB cnn vocoder fftnet Python
1
音效插件
2021-08-03 09:45:37 1.19MB 音效插件
1
这个 MATLAB 练习实现了一个相位声码器,它能够将语音或音频信号加速或减速因子“r”,其中“r”从 0.25(减速因子 4)到“r” '=40(加速因子为 4)。 加速或减速通过内插短时傅立叶变换 (STFT) 幅度并计算信号的相位超前来实现。 文件“5.16 Phase Vocoder.pdf”提供了本练习的用户指南。
2021-07-14 19:21:53 1.91MB matlab
1