行业分类-电子政务-一种声音识别开关电视机.zip
1
10种语音的分类:冷气机,汽车喇叭,儿童玩耍,狗吠声,钻孔,发动机空转,枪射击,手持式凿岩机,警笛,街头音乐。每个录音长度约为4s,被放在10个fold文件中。百度网盘分享,永久有效。附163邮箱,有事随时邮件
1
Sound-Similar (免费版)是一个轻巧的工具软件,可用于测量两个具有线性PCM格式的WAV声音文件在听觉上的相似度。这种格式是WAV文件中最常见的。相似度以百分比0%~100%来表示。它不是通过对两个数字文件进行一个字节一个字节的对比而得,也不是通过对时域波形的形状进行对比而得,而是基于人的听觉感受,通过一系列的时域、频域和时频域分析得到的。测得的相似度可用于声音的归类以及基于听感的声音质量检测。 两个WAV文件可以具有不同的采样频率、不同的采样位数以及一个或两个通道的数据。如果是双声道信号,则对比中采用的是两个通道的平均值。声音的音量差别不会影响相似度的测量,除非音量小到足以影响所能感知到的声音品质。 不同类别的声音,例如语音、音乐、和环境声音,可能具有不同的频率范围。 Sound-Similar允许用户指定用于对比的频率范围以提高相似度测量的准确度。频率范围可以延伸到次声波或超声波范围。 有两种对比模式:(1)全长vs全长(Full Length vs Full Length) (2) 短文件的全长vs长文件的部分长度(Full Length of the Shorter vs Partial Length of the Longer)。这两种模式都允许两个文件有不同的时间长度。模式2可用于判断短文件是否是长文件中的一部分。如果是的话,给出其在长文件中的具体位置。声音长度应大于50毫秒,且应大于所设置的频率低限的倒数。声音长度的高限则只受制于电脑的内存大小。 本软件中的相似度评分算法是按常规用途来优化的。低于几个百分点的相似度通常表示两个声音完全不同,而从几个百分点到100%表示两个声音是相似的,只是相似程度不同。也就是说,Sound-Similar不仅可以用来进行声音归类,而且也可以用来检测声音跟标准样本对比后的质量差别。
1
基于KNN算法的声音分类训练及识别MATLAB代码,可以有效对检测的声音类型进行分类
2021-05-08 10:01:01 16.16MB KNN MATLAB 声音识别 分类
1
包括:1、通用背景稀疏编码和多层自举网络(UBSC-MBN)算法的matlab程序(matlab2016a),用于说话人识别,2、10个说话人的训练数据集。
2021-04-28 11:12:38 3.43MB UBSC-MBN 说话人识别 深度学习 MATLAB2016
1
matlab开发-环境声音识别。使用多支持向量机的音频分类
2021-04-20 19:24:11 3.55MB 未分类
1
python代码文件,可以将视频导出的音频切割得到声音停顿文件,并附带时间信息,从而很容易生成srt字幕文件,为没有字幕的视频轻松加字幕
1
caffe的介绍及安装,利用caffe简便地进行深度学习
2019-12-21 22:22:10 5.1MB caffe 深度学习 声音识别
1
Urbansound8K 是目前应用较为广泛的用于自动城市环境声分类研究的公共数据集。这个数据集一共包含8732条已标注的声音片段(<=4s),包含10个分类:空调声、汽车鸣笛声、儿童玩耍声、狗叫声、钻孔声、引擎空转声、枪声、手提钻、警笛声和街道音乐声。 (百度云网盘分享)
1
提取声音特征的文件,代码可参考:http://blog.csdn.net/u011599639
2019-12-21 21:23:09 283KB 声音识别性别
1