使用matlab编写的就与语音识别的门禁系统,首先录取一个人的语音信号,存储到数据库中,并分配ID号。然后当其要进入时候,对其声音进行录取识别,如果在系统中,门就开
2021-06-04 09:12:25 321KB 语音识别 门禁
1
语音数据集下载地址,永久有效。近几年来语音识别技术得到了迅速发展,从手机中的Siri语音智能助手、微软的小娜以及各种平台的智能音箱等等,各种语音识别的项目得到了广泛应用。语音识别属于感知智能,而让机器从简单的识别语音到理解语音,则上升到了认知智能层面,机器的自然语言理解能力如何,也成为了其是否有智慧的标志,而自然语言理解正是目前难点。
2021-06-03 22:43:56 90B 语音识别
1
中国AI语音识别市场研究报告(2020.pdf
2021-06-02 22:01:51 2.69MB 人工智能 语音识别
语音识别+录音程序
2021-06-02 14:40:02 17.59MB 语音识别
1
使用matlab编写的语音识别项目,可以进行实验,也可以在我的项目之上进行改进和改善。
2021-06-01 15:31:42 2.96MB matlab 语音识别
1
一、批转PDF 1、支持以下格式转成PDF *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.ppt;*.pptx;*.dsp;*.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff 2、添加文件,有以下三种模式(以下均一致) (1)添加文件:可一次添加以上类型的多个文件 (2)添加目录:可添加一个文件夹中包含以上类型的文件 (3)拖拽文件及目录:可将文件目录及文件直接拖拽到表格中,自动将以上类型外的文件过滤 3、右键菜单 (1)删除选中 (2)上移选中 (3)下移选中 4、顺序拖拽:可以将某一行记录进行拖拽,改变顺序 二、批转其他:批量支持将pdf转word、Excel、ppt 三、拆分PDF 批量将PDF拆分,例如某文件转成PDF为10页,按每3页一个文件,可拆分成4个文件,页数分别为3、3、3、1页 四、合并PDF:支持以下格式转成PDF,并合并为一个文件 *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.ppt;*.pptx;*.dsp;*.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff 五、批量打印 1、支持以下文件批量打印 *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.ppt;*.pptx;*.dsp;*.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff 2、打印模式 (1)全部文件:10个材料打印N份,N次重复10个材料分别打印1份。 (2)逐个文件:10个材料打印N份,10次重复N个材料分别打印1份。 3、页面模式 (1)1->1,一页打印到1张 (2)2->1,两页打印到1张 (3)4->1,四页打印到1张 六、文字识别 1、支持以下文件文字识别 *.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff、剪贴板图像内容(Ctrl+V) 2、识别模式 (1)多合一:将识别出的文字,合并到一个txt文件。 (2)一对一:每个文件识别出的文字,放到同样文字名的txt文件。 3、系统配置-文字:注册百度文字识别账户ID 七、语音识别 1、支持以下文件文字识别 *.mp3;*.m4a;*.pcm;*.wav;*.amr,生成同名字txt文件。 2、系统配置-语音:注册百度语音识别账户ID 八、语音合成 1、支持以下文件合成 *.txt;*.doc;*.docx;*.wps 2、系统配置-语音:修改语速、音调、音量、发音。 九、文件更名:支持所有文件的批量更名 十、内容替换:支持以下文件内容替换 *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.txt 十一、拆合Excel 批量将excel拆分和合并,根据sheet表进行拆分为多个excel文件或根据excel的sheet合并为一个excel文件。
1
QT 实现语音识别功能.tar.gz
2021-06-01 09:04:50 6.93MB 人工智能
1
STM32C8T6+语音识别LD3320+文字转语音SYN6288原理图及PCB全套文件,保证可用
2021-05-31 19:01:27 1.85MB LD3320 语音识别 SYN6288 文字转语音
1
LD3323语音识别模块,内部集成了STC11L08XE单片机,可实现语音识别功能,包括原理图以及STM32驱动等
2021-05-30 15:43:08 170.22MB 语音识别 stc11L08XE LD3323
1
LD3320识别芯片介绍: LD3320 是一颗基于非特定人语音识别 (SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别/声控芯片。提供了真正的单芯片语音识别解决方案。 LD3320 芯片上集成了高精度的 A/D 和 D/A 接口,不再需要外接辅助的Flash 和 RAM,即可以实现语音识别/声控/人机对话功能。并且,识别的关键词语列表是可以动态编辑的。 基于 LD3320,可以在任何的电子产品中,甚至包括简单的 51 作为主控芯片的系统中,轻松实现语音识别/声控/人机对话功能。为所有的电子产品增加 VUI(Voice User Interface)语音用户操作界面。 LD3320语音识别模块视频演示: 语音识别LD3320模块主要特色功能: 非特定人语音识别技术:不需要用户进行录音训练 可动态编辑的识别关键词语列表:只需要把识别的关键词语以字符串的形式传送进芯片,即可以在下次识别中立即生效。比如,用户在 51 等 MCU 的编程中,简单地通过设置芯片的寄存器,把诸如“你好”这样的识别关键词的内容动态地传入芯片中,芯片就可以识别这样设定的关键词语了。 真正单芯片解决方案:不需要任何外接的辅助 Flash 和 RAM,真正降低系统成本。 内置高精度 A/D和D/A通道:不需要外接 AD 芯片,只需要把麦克风接在芯片的AD 引脚上;可以播放声音文件,并提供 550mW 的内置放大器。 高准确度和实用的语音识别效果。 支持用户自由编辑 50 条关键词语条:在同一时刻,最多在 50 条关键词语中进行识别,终端用户可以根据场景需要,随时编辑和更新这 50 条关键词语的内容。 LD3320与Arduino实物连接图: 相关链接:LD3320 在Arduino上的应用 LD3320模块主要技术参数内置单声道mono 16-bit A/D 模数转换 内置双声道stereo 16-bit D/A 数模转换 内置 20mW 双声道耳机放大器输出 内置 550mW 单声道扬声器放大器输出 支持并行接口或者 SPI 接口 内置锁相电路 PLL,输入主控时钟频率为 2MHz - 34MHz 工作电压:(VDD: for internal core) 3.3V 48pin 的 QFN 7*7 标准封装 省电模式耗电:1uA 内置单声道mono 16-bit A/D 模数转换 内置双声道stereo 16-bit D/A 数模转换 内置 20mW 双声道耳机放大器输出 内置 550mW 单声道扬声器放大器输出 支持并行接口或者 SPI 接口 内置锁相电路 PLL,输入主控时钟频率为 2MHz - 34MHz 工作电压:(VDD: for internal core) 3.3V 48pin 的 QFN 7*7 标准封装 省电模式耗电:1uA LD3320示例程序截图(具体的演示详见附件内容): 技术文档截图: 实物购买链接:https://www.waveshare.net/shop/LD3320-Board.htm
2021-05-30 15:37:35 3.14MB ld3320 语音识别 电路方案
1