上传者: 42161497
|
上传时间: 2022-02-10 21:48:53
|
文件大小: 6.7MB
|
文件类型: -
说话人二值化
说话人区分系统
内容
从wav文件中提取特征,然后通过无监督学习或有监督学习得出说话人识别以及某个说话人的语音起点,终点
数据预处理
###无监督学习
wavs --> features --> kmeans(silhouette) --> num of speaker and time point
要求
scipy
librosa
sklearn
numpy