智能语音识别芯片LD3320资料(技术开发手册)。 1、包括PDF格式文档:LD3320数据手册。 2、包括PDF格式文档:LD3320开发手册。 3、包括PDF格式文档:LD3320并行串行读写辅助说明。 4、以上文档中含智能语音识别芯片LD3320的开发参考程序代码和参考电路图。 5、LD3320是一款语音识别芯片,一般用于人工智能的自动语音识别场合。
2022-12-21 16:28:34 1.57MB LD3320 人工智能 语音识别 技术开发手册
1
本源程序代码的目的是给出语音情感计算的概况以及最新进展,探讨语音情感计算的整个过程。首先,介绍了语音情感计算的定义以及它的交叉学科的本质。接下来,从数字信号处理的角度研究了基于最常用的数字语音信号特征——MFCC的语音情感检测的全过程。然后,利用柏林语音情感数据库分析了在提取MFCC的过程中一些具体的参数的选择对检测结果准确率的影响。最后,阐述了语音情感计算领域面临的挑战以及今后的可能发展趋势。 用的是柏林语音情感数据库,最终的识别率勉强接近50%,存在的问题我也思考了,但是一时解决不了。
2022-12-21 13:42:55 20KB 语音情感识别
1
提取均值信号特征的matlab代码两个扬声器的基于 LSTM/BLSTM 的 PIT 在多通话者混合语音分离和识别方面取得的进展,通常被称为“鸡尾酒会问题”,并没有那么令人印象深刻。 尽管人类听众可以很容易地感知混合声音中的不同来源,但对于计算机来说,同样的任务似乎极其困难,尤其是当只有一个麦克风记录混合语音时。 1. 运行性能 注意:训练集和验证集包含通过从 WSJ0 集中随机选择说话者和话语生成的两个说话者混合,并以 -2.5 dB 和 2.5 dB 之间统一选择的各种信噪比 (SNR) 混合它们. 对于LSTM ,不同性别的混合音频结果如下: 对于BLSTM ,不同性别的混合音频结果如下: 从上面的结果可以看出,混合性别音频的分离效果优于同性音频,BLSTM 的性能优于 LSTM。 2. 评价标准 SDR:信号失真比 SAR:信号与伪像的比率 SIR:信号干扰比 STOI:短期客观可懂度测量 ESTOI:扩展的短期目标可懂度测量 PESQ:语音质量的感知评估 3. 依赖库 matlab(我的测试版:R2016b 64位) tensorflow(我的测试版本:1.4.0) anac
2022-12-21 11:33:49 5.37MB 系统开源
1
开发工具:vs2008,基于MFC开发。使用微软tts api,实现对文本的朗读、停止。里面有设置语音大小、语音库选择、朗读开始、朗读停止等操作。希望对大家有帮助。
2022-12-20 19:09:27 22.54MB TTS MFC
1
数字化语音存储与回放系统,详细讲述程序流程,还有其中所包括的电路
2022-12-20 15:26:08 153KB flash dma
1
语音朗读-语音识别安卓Android源代码
2022-12-19 16:20:21 5.19MB Android源代码 语音朗读 语音识别
利用windows自带的TTS功能,可编辑文字,自动转换成生成wav文件。 生成的文件保存在d:\根目录下。
2022-12-18 11:04:05 572KB TTS 文字转语音 windows自带
1
----------------------- IVR语音流程图全文共1页,当前为第1页。
2022-12-16 17:14:09 576KB 文档资料
1
AI语音电话机器人源码全套,包含数据库,函教程,自行搭建,系统稳定可靠,适用于电销、客服等领域,可批量导入表格,自定义录制划算,全自动拨打电话寻找客户,目标客户可对接微信公众号进行推送数据
2022-12-16 09:28:00 102.19MB ai 源码 网页端
基于yolov4实现飞鸟入侵检测语音告警系统(含GUI登录界面和模型).7z darknet版yolov4实现 带GUI登录操作界面及训练好的模型,可检测飞鸟视频,发出语音告警。 windows环境运行 应用场景:飞机场航空预警等