个人写的测试用列,用科大讯飞的sdk。还不错,挺好玩的。分享大家
2021-12-21 16:18:57 2.14MB C# 科大讯飞 语音识别 文字合成
1
使用场景:例如记录动物叫声,然后再卡上绘制或粘贴对应的动物介绍,通过刷卡可以听到此动物的叫声。当然还有其它用法,发挥自己的想想吧。对于小朋友是个不错的玩具~
2021-12-21 13:08:19 2.03MB 语音识别
1
实时上传语音arraybuffer by websocket.io 支持采样率和声道数量配置 支持Blob和arraybuffer以及file方式上传 录音支持WAV和PCM语音文件,并支持下载 客户端实现思路 客户端使用HTML5的getUserMedia接口和AudioContext对象。 首先,通过AudioContext.createMediaStreamSource方法创建一个MediaStreamAudioSourceNode, 用于接受本地计算机麦克风的音频输入。 再通过AudioContext的createScriptProcessor方法创建一个ScriptProcessorNode,用于处理音频采集操作。 然后,通过connect方法将麦克风的音频输入和音频采集链接。通过监听audioprocess事件,将采集的音频数据保存在配置的固定长度的数组内。客户端不能直接发送数
2021-12-21 11:01:49 12.86MB blog websockets socket-io audiocontext
1
智能垃圾桶设计,可语音识别干垃圾、湿垃圾、可回收垃圾和有害垃圾,并利用舵机控制垃圾桶开合。包含原理图PCB及源程序文件
2021-12-18 15:01:38 15.25MB STM32 LD2330 语音识别
主要介绍了微信小程序通过websocket实时语音识别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
1
解决win7控制面板中没有语音识别的情况,方便于系统开发调试之用
2021-12-16 14:54:37 3.38MB 语音识别
1
html 在线语音识别,直接可用,仅供学习,禁止商业用途,如需商业请寻找科大讯飞合作谢谢。
2021-12-16 11:25:27 52KB 语音识别
1
pcm格式朗读音乐测试文件pcm格式朗读音乐测试文件pcm格式朗pcm格式朗读音乐测试文件读音乐测试pcm格式朗读音乐测试文件文件pcm格式朗读音乐测试文件
2021-12-16 10:37:30 22.37MB pcm语音识别
1
CSTR语音克隆英语多说话人语料库工具包 概述 这个CSTR VCTK语料库包含了109个以不同口音为母语的英语使用者的语音数据。 每位演讲者要朗读大约400句句子,其中大部分是从报纸上挑选出来的,再加上彩虹段落和一段旨在识别演讲者口音的启事段落。 这些报纸文本是在先驱时报集团(Herald & Times Group)的许可下,从格拉斯哥的《先驱报》(The Herald)上摘取的。 每位演讲者阅读一组不同的报纸句子,每组句子都是通过贪婪算法选择的,该算法旨在最大限度地扩大上下文和语音覆盖范围。 彩虹段落和启发性段落对所有演讲者都是一样的。 彩虹之旅可以在国际英语方言档案(http://web.ku.edu/~idea/readings/rainbow.htm)中找到。 引出段落与用于语音重音存档(http://accent.gmu.edu)的段落相同。 语音口音档案的细节可以在http://www.ualberta.ca/~aacl2009/PDFs/WeinbergerKunath2009AACL.pdf上找到 所有的语音数据都是使用相同的录音设置记录的:一个全向头戴式麦克风(DPA 4035),采样频率为96kHz, 24位,在爱丁堡大学的半暗室中。 所有录音均转换为16位,基于STPK下采样至48 kHz,并手动端点。 该语料库的录制是为了构建基于hmm的文本-语音合成系统,特别是用于使用多个发言者训练的平均语音模型和发言者自适应技术构建基于发言者自适应的语音合成系统。 复制 该语料库是在开放数据共享署名许可(ODC-By) v1.0下授权的。 http://opendatacommons.org/licenses/by/1.0/ http://opendatacommons.org/licenses/by/summary/ 下载 http://dx.doi.org/10.7488/ds/1994 确认 CSTR VCTK语料库由: Christophe Veaux(爱丁堡大学) Junichi Yamagishi(爱丁堡大学) 克里斯汀•麦克唐纳 导致这些结果的研究部分得到了EPSRC EP/I031022/1 (NST)和EP/J002526/1 (CAF)的资助,来自RSE-NSFC的资助(61111130120)和JST CREST (uDialogue)的资助。
2021-12-15 17:00:37 838B VCTK dataset 语音识别 语音数据集
1
基于HTK 的语音识别例子,包含了指导文件,操作说明等等
2021-12-15 15:09:54 8.84MB HTK 语音识别 例子
1