在Linux环境下,C语言编写服务器,完成的功能是利用v4l2技术采集usb摄像头视频,传输到Qt客户端显示。其中还有百度语音识别的动能。
2023-02-06 14:52:51 597KB v4l2 tuling 语音识别
1
科技在进步,残疾人想使用电脑,键盘这种输入装置对于残疾人来说不够方便,于是在跟一些资深玩家们头脑激荡时,想到了可以用头部输入的方式,就是这个头戴式肌电鼠标! 用该设备采用运动感应、肌电传感、语音识别等技术,可以实现: 1. 用陀螺仪将头部运动转化为鼠标运动,从而解放双手,帮助双手行动不便及单/双臂缺失的人。 2. 肌肉电传感器检测牙齿咀嚼肌的咬合,实现鼠标单击双击。 3. 语音可选控制/输入模式,控制模式可实现命令控制,如“复制”“粘贴”等;输入模式可将语音转换为文字。从而实现快速控制与输入。 4. 运动感应器,实现坐姿检测、颈椎病预防等功能; 硬件列表: 视频展示: 详细制作过程详见附件! 【转载自DF社区】
2023-02-03 17:20:56 922KB 语音识别 运动感应 电路方案
1
MASR的V2版本训练Conformer模型文件,使用Fbank,Pytorch,训练数据为超大数据集,13000+小时。 源码地址:https://github.com/yeyupiaoling/MASR
2023-02-02 17:35:43 435.03MB pytorch asr 语音识别 wenetspeech
语音识别 使用TensorFlow实现语音识别系统。 中篇文章的更多说明: : 二手图书馆 pip install tensorflow tensorflow_io 文件说明 test_load.py 加载Mozilla Common Voice的标签文件: : test_lstm.py 简单的LSTM模型可预测单词序列中的下一个单词。 它使用Mozilla Common Voice数据集标签文件。 test_trad.py Seq2Seq模型以与输入相同的语言翻译句子。 它使用Mozilla Common Voice数据集标签文件。 test_words.py 简单的LSTM模型可将音频转换为单词。 它使用语音命令数据集: : test_wordsFr.py 简单的LSTM模型可将音频转换为法语单词。 它使用此存储库中包含的自制数据集。 test_words_com
2023-01-30 10:23:58 13.83MB Python
1
有监督语音识别综述--表格型 包含文章名,时间,方法,优缺点,与其他网络总结,实验结果
2023-01-29 00:32:20 19KB 语音识别 人工智能
1
经过几十年的研究与发展,语音识别建立了以隐马尔可夫模型(Hidden Markov Models,HMM)为基础的框架。近几年,在HMM基础上深度神经网络(Deep Neural Network,DNN)的应用大幅度提升了语音识别系统的性能。DNN将每一帧语音及其前后的几帧语音拼接在一起作为网络的输入,从而利用语音序列中上下文的信息。DNN中每次输入的帧数是固定的,不同的窗长对最终的识别结果会有影响。递归神经网络(Recurrent neural network,RNN)通过递归来挖掘序列中的上下文相关信息,在一定程度上克服了DNN的缺点。但是RNN在训练中很容易出现梯度消失的问题,无法记忆长时信息。长短期记忆单元(Long Short-Term Memory,LSTM)通过特定的门控单元使得当前时刻的误差能够保存下来并选择性传给特定的单元,从而避免了梯度消失的问题。本文对RNN及LSTM的基本原理进行了介绍,并且在TIMIT语音数据库上进行了实验。实验结果表明,LSTM型递归神经网络在语音识别上的可以取得较好的识别效果
2023-01-22 13:59:06 280KB LSTM
1
matlab精度检验代码ECE 5775最终项目 基于神经网络的Xilinx Zedboard上具有固定延迟的语音命令识别方法 ,和的项目。 每个文件夹及其内容的说明如下 audio_lab 它包含Xilinx Vivado和SDK项目,以将位流编程到FPGA并配置如何将数据发送到FPGA。 合并的 这包含我们基于Xilinx Vivado HLS对FPGA综合进行的集成测试,该测试基于3种不同的数据类型。 这些基于float数据类型,双精度float数据类型和Xilinx ap_fixed数据类型。 ap_fixed数据类型具有最快的运行时间,但就位宽而言并不是非常优化。 组件 Matlab的 该文件夹包含用于在MATLAB中生成训练和测试数据的所有必需文件。 在文件中查找更多详细信息 神经网络 该文件夹包含三层神经网络实现。 它学习使用前馈网络,然后进行反向传播。 分类输入以随机顺序输入网络。 在每个输入通过网络馈送之后,将检查每个输出神经元的值,并将其与所需的输出进行比较,以获取误差。 该误差通过层之间的所有边缘传播回去,并且权重在“学习”过程中进行调整。 重复该过程,直到达到期
2023-01-11 19:30:18 67.01MB 系统开源
1
进行语音识别的时候会用到timit语音资料库进行训练,但是该资料又很难寻找,于是我将其上传至csdn,希望可以帮助到更多的人。由于csdn上传文件大小限制,我将全部文件拆成三部分,这个是第3部分,其内包含TRAIN文件夹的后半部分,也就是后四个英语方言地区的语音数据。
2023-01-06 17:22:50 136.13MB 人工智能 timit语音资料库 语音识别 kaldi
1
XiaoAiLite_qr_v2.8.70.apk
2023-01-02 11:18:53 35.35MB AI Android apk 语音识别
1
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。
1