我收藏的对语音识别技术研究的英文论文,感兴趣的可以参考一下
2022-03-04 00:30:36 477KB 语音识别
1
【语音识别】基于MFCC实现声纹识别matlab源码.md
2022-03-03 14:50:05 10KB 算法 源码
1
Ar_project 本人参加2020全国大学生物联网设计大赛所做项目负责的软件部分,获得华东赛区特等奖、全国总决赛二等奖。 该项目包含了导航系统、语音系统、目标检测系统三个部分,涵盖语音唤醒、语音识别、语音合成、语音导航、聊天机器人、目的地搜索、路径规划、车道分割、目标检测(车、车牌、违规车、路标等)、车牌识别等一整套快速解决方案!(附带的两个模型为基于玩具车和模型道路数据集的....) 项目技术架构如下图 目录结构 Project ├─AR_project_PI │ │ ARPImain.py //树莓派客户端主程序,用于调度树莓派端一切数据传输线程、界面更新、信号处理等,整合树莓派端的语音控制系统、导航系统、数据传输系统 │ │ ARui.py //主界面类,调用webBrowser类实现内嵌浏览器功能,定义所有界面信号的槽函数 │ │ Arrowclass.py //箭
2022-03-02 01:12:07 110.94MB Python
1
百度语音识别接口c#版 版本3.4.0 目前本SDK的功能同REST API,需要联网调用http接口, 具体功能见REST API 文档, REST API 仅支持整段语音识别的模式,即需要上传完整语音文件进行识别,时长不超过60s,支持、自定义词库设置, 没有其他额外功能。(官方示例sdk,)
2022-03-01 15:59:11 724KB 语音识别 百度语音识别
1
云知声“语音+语义”一站式解决方案(安卓版本),内含app key下载直接可用。可以实现语音转文字、文字转语音、理解语言真实意思的功能,内含36个已优化好的生活类服务,
2022-03-01 13:21:13 3.39MB 云知声 语音 语义
1
TIMIT数据集是来自美国630个人每个人说十个给定的句子,每一个句子都有标记 TIMIT数据集介绍 如:这篇博客:http://blog.csdn.net/jie8895010/article/details/52425784 格式如下: ID ;--- ---- ----------------------- ---------------- ABC0 1 2 331 61 241 421 151 781 1620 2041 ABW0 1 2 134 314 44 224 404 1230 1664 2294 ADC0 1 2 287 17 197 377 107 737 1367 1997 ADD0 1 2 88 268 448 178 358 538 1295 1798 ADG0 1 2 199 379 109 289 19 649 1279 1909 AEB0 1 2 90 270 450 180 360 990 1411 2250 AEM0 1 2 312 42 222 402 132 762 1392 2022 AEO0 1 2 246 426 156 336 66 1655 1326 1956 AFM0 1 2 39 219 399 129 309 939 1569 2199 AHH0 1 2 214 394 124 304 34 664 1294 1924 AJC0 1 2 385 115 295 25 205 835 1946 2095 ————————————————
2022-02-28 17:14:32 342.65MB 语音识别
1
语言提示电路 ISD2560芯片采用多电平直接模拟量存储专利技术,每个采样值直接存储在片内单个E2PROM单元中,不需另加A/D或D/A变换来存储和重放,能够非常自然、真实地再现语音,音乐,音调和效果声,避免了一般固体录音电路因量化和压缩造成的量化噪声和“金属声”,因此,作为目前国内外较为理想的语音芯片,在许多领域得到了广泛地应用。语音芯片音质的优劣、功能的强弱决定了报站器的语音效果和性能。 如图所示,语音控制电路由单片机完成。其中,系统中单片机P0端口为单片机与语音芯片的通讯口。ISD2560中,模拟电源(VCCA)和数字电源(VCCD)使用不同的电源总线,分别引到外封装上;模拟地(VSSA)和数字地(VSSD)也使用不同的地线。
1
关于 Vosk是一个离线开源语音识别工具包。 它支持17种语言和方言的语音识别模型-英语,印度英语,德语,法语,西班牙语,葡萄牙语,中文,俄语,土耳其语,越南语,意大利语,荷兰语,加泰罗尼亚语,阿拉伯语,希腊语,波斯语,菲律宾语。 Vosk模型很小(50 Mb),但提供连续的大词汇量转录,具有流API的零延迟响应,可重新配置的词汇量和说话者识别。 为各种编程语言(如Python,Java,Node.JS,C#,C ++等)实现的语音识别绑定。 Vosk为聊天机器人,智能家电,虚拟助手提供语音识别。 它还可以为电影创建字幕,为演讲和访谈创建转录字幕。 Vosk从Raspberry Pi或Android智能手机等小型设备扩展到大型集群。 文献资料 有关安装说明,示例和文档,请访问。
2022-02-28 15:23:29 264KB android python raspberry-pi ios
1
HMM+GMM语音识别技术详解级PMTK3中的实例-附件资源
2022-02-28 09:02:07 23B
1
这个工具包是语音文件进行hmm识别的工具包。
2022-02-28 09:00:49 36KB hmm工具包
1