使用matlab编写的语音识别项目,可以进行实验,也可以在我的项目之上进行改进和改善。
2021-06-01 15:31:42 2.96MB matlab 语音识别
1
一、批转PDF 1、支持以下格式转成PDF *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.ppt;*.pptx;*.dsp;*.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff 2、添加文件,有以下三种模式(以下均一致) (1)添加文件:可一次添加以上类型的多个文件 (2)添加目录:可添加一个文件夹中包含以上类型的文件 (3)拖拽文件及目录:可将文件目录及文件直接拖拽到表格中,自动将以上类型外的文件过滤 3、右键菜单 (1)删除选中 (2)上移选中 (3)下移选中 4、顺序拖拽:可以将某一行记录进行拖拽,改变顺序 二、批转其他:批量支持将pdf转word、Excel、ppt 三、拆分PDF 批量将PDF拆分,例如某文件转成PDF为10页,按每3页一个文件,可拆分成4个文件,页数分别为3、3、3、1页 四、合并PDF:支持以下格式转成PDF,并合并为一个文件 *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.ppt;*.pptx;*.dsp;*.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff 五、批量打印 1、支持以下文件批量打印 *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.ppt;*.pptx;*.dsp;*.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff 2、打印模式 (1)全部文件:10个材料打印N份,N次重复10个材料分别打印1份。 (2)逐个文件:10个材料打印N份,10次重复N个材料分别打印1份。 3、页面模式 (1)1->1,一页打印到1张 (2)2->1,两页打印到1张 (3)4->1,四页打印到1张 六、文字识别 1、支持以下文件文字识别 *.pdf;*.bmp;*.jpg;*.jpeg;*.png;*.tiff、剪贴板图像内容(Ctrl+V) 2、识别模式 (1)多合一:将识别出的文字,合并到一个txt文件。 (2)一对一:每个文件识别出的文字,放到同样文字名的txt文件。 3、系统配置-文字:注册百度文字识别账户ID 七、语音识别 1、支持以下文件文字识别 *.mp3;*.m4a;*.pcm;*.wav;*.amr,生成同名字txt文件。 2、系统配置-语音:注册百度语音识别账户ID 八、语音合成 1、支持以下文件合成 *.txt;*.doc;*.docx;*.wps 2、系统配置-语音:修改语速、音调、音量、发音。 九、文件更名:支持所有文件的批量更名 十、内容替换:支持以下文件内容替换 *.doc;*.docx;*.wps;*.xls;*.xlsx;*.csv;*.et;*.txt 十一、拆合Excel 批量将excel拆分和合并,根据sheet表进行拆分为多个excel文件或根据excel的sheet合并为一个excel文件。
1
QT 实现语音识别功能.tar.gz
2021-06-01 09:04:50 6.93MB 人工智能
1
STM32C8T6+语音识别LD3320+文字转语音SYN6288原理图及PCB全套文件,保证可用
2021-05-31 19:01:27 1.85MB LD3320 语音识别 SYN6288 文字转语音
1
LD3323语音识别模块,内部集成了STC11L08XE单片机,可实现语音识别功能,包括原理图以及STM32驱动等
2021-05-30 15:43:08 170.22MB 语音识别 stc11L08XE LD3323
1
LD3320识别芯片介绍: LD3320 是一颗基于非特定人语音识别 (SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别/声控芯片。提供了真正的单芯片语音识别解决方案。 LD3320 芯片上集成了高精度的 A/D 和 D/A 接口,不再需要外接辅助的Flash 和 RAM,即可以实现语音识别/声控/人机对话功能。并且,识别的关键词语列表是可以动态编辑的。 基于 LD3320,可以在任何的电子产品中,甚至包括简单的 51 作为主控芯片的系统中,轻松实现语音识别/声控/人机对话功能。为所有的电子产品增加 VUI(Voice User Interface)语音用户操作界面。 LD3320语音识别模块视频演示: 语音识别LD3320模块主要特色功能: 非特定人语音识别技术:不需要用户进行录音训练 可动态编辑的识别关键词语列表:只需要把识别的关键词语以字符串的形式传送进芯片,即可以在下次识别中立即生效。比如,用户在 51 等 MCU 的编程中,简单地通过设置芯片的寄存器,把诸如“你好”这样的识别关键词的内容动态地传入芯片中,芯片就可以识别这样设定的关键词语了。 真正单芯片解决方案:不需要任何外接的辅助 Flash 和 RAM,真正降低系统成本。 内置高精度 A/D和D/A通道:不需要外接 AD 芯片,只需要把麦克风接在芯片的AD 引脚上;可以播放声音文件,并提供 550mW 的内置放大器。 高准确度和实用的语音识别效果。 支持用户自由编辑 50 条关键词语条:在同一时刻,最多在 50 条关键词语中进行识别,终端用户可以根据场景需要,随时编辑和更新这 50 条关键词语的内容。 LD3320与Arduino实物连接图: 相关链接:LD3320 在Arduino上的应用 LD3320模块主要技术参数内置单声道mono 16-bit A/D 模数转换 内置双声道stereo 16-bit D/A 数模转换 内置 20mW 双声道耳机放大器输出 内置 550mW 单声道扬声器放大器输出 支持并行接口或者 SPI 接口 内置锁相电路 PLL,输入主控时钟频率为 2MHz - 34MHz 工作电压:(VDD: for internal core) 3.3V 48pin 的 QFN 7*7 标准封装 省电模式耗电:1uA 内置单声道mono 16-bit A/D 模数转换 内置双声道stereo 16-bit D/A 数模转换 内置 20mW 双声道耳机放大器输出 内置 550mW 单声道扬声器放大器输出 支持并行接口或者 SPI 接口 内置锁相电路 PLL,输入主控时钟频率为 2MHz - 34MHz 工作电压:(VDD: for internal core) 3.3V 48pin 的 QFN 7*7 标准封装 省电模式耗电:1uA LD3320示例程序截图(具体的演示详见附件内容): 技术文档截图: 实物购买链接:https://www.waveshare.net/shop/LD3320-Board.htm
2021-05-30 15:37:35 3.14MB ld3320 语音识别 电路方案
1
微信小程序云开发人机聊天室语音识别,跟人机聊天,可输入文字可语音,人机从云数据库匹配答案转语音播放
2021-05-29 11:16:38 231KB 微信小程序云开发人机聊天室
1
SpeechRecognition_DFCNN 语音识别
2021-05-27 11:04:57 147.96MB SpeechRecognitio
1
多命令语音识别范例
2021-05-27 10:08:20 340KB 多命令语音识别范例
1
本工程采用vc++6.0编写的MFC工程,开发了一个GUI界面。特征提取采用MFCC算法,识别部分采用的是VQ识别算法,很辛苦才编出来的,希望能给大家带来帮助。 不能运行不要积分喔!
2021-05-26 15:04:07 4.7MB MFCC VQ
1