采用百度AI平台进行语音识别与合成,里面有我打包好的exe文件,附赠图灵机器人的一组api账号,有问题可以加我QQ咨询
2021-07-20 20:17:50 64KB 人工智能 对话机器人 语音 百度API
1
项目里面用到了语音唤醒功能,前面一直在用讯飞的语音识别,本来打算也是直接用讯飞的语音唤醒,但是讯飞的语音唤醒要收费,试用版只有35天有效期。只好改用百度语音,百度语音所有功能免费,功能也比较简单实用,包括语音识别,语音合成和语音唤醒,正好可以组成一套完整的语音交互功能。 效果图: 首先是语音唤醒功能,说出关键词即可叫语音识别,唤醒成功会有语音提示,这里采用了百度语音的合成功能。然后百度语音识别会根据wifi情况自动切换在线或者离线识别,但是离线识别只能识别已经导入的关键词,而且离线第一次识别需要联网,识别成功,同样会有语音提示。效果图gif没有声音,Toast显示的时候就是语音提示的内容。
2021-07-07 11:20:57 128KB id string 百度
1
ROS包,python代码,主要三个文件 1、ROS_baidu_voice.py:用百度语音云服务实现语音识别,并将识别结果简单分类发送到 话题/cmd_vel_mux/input/teleop或话题camera_op或话题camera_reply,分别用于控制小车速度、打卡摄像头进行图像识别和进行语音交互; 2、ROS_baidu_reply.py:用于进行语音交互,使用图灵机器人云服务和百度语音合成云服务实现与人交互的功能,订阅camera_reply话题(其内容是图像识别结果或语音识别结果),并对其内容进行语音回复; 3、ROS_tf_camera.py:摄像头拍照并图像识别,使用tensorflow的SSD模型进行离线本地图像识别,订阅camera_op话题,发布camera_reply话题 注:文件夹aip是用于百度语音识别与合成的百度官方库,(data,protos,ssd_mobilenet_v1_coco_2017_11_17,test_images,utils)是进行图像识别的资源库. 百度和图灵机器人的ID和密码请自行注册获取,其云服务是免费的,语音交互部分也可参考:https://www.bilibili.com/video/av18979530?from=search&seid=9614670617590001248
2021-07-05 11:58:03 26.06MB ROS python 语音交互 图像识别
1
智慧家庭全屋分布式语音交互规范标准解读.pdf
科大讯飞KTV语音交互方案
2021-06-10 22:02:05 512KB 科大讯飞
1
物联网( IoT ,Internet of things )即“万物相连的互联网”,基于语音交互、文字识别、人脸识别、人体识别、AR等多项AI技术,赋能软硬件教学产品,实现更好的人机交互的教学体验,用更低的师资成本获得高质量的教育效果;同时打造智慧校园,实现校园安全、校内考勤、课堂效果监测等关键场景业务升级,提升校园生活体验和安全性,降低管理成本。 智慧教育则是采用“端 - 云”的总体架构,实现校园“人”、“物”、“业”三个方面的全面、便捷服务,实现高效决策、便捷服务、统筹集约、精细管理的目标。
2021-05-26 13:02:07 13.84MB 智慧教育 万物互联 语音交互 人脸识别
时下智能语音交互市场火热,越来越多的设备都开始支持远场AI语音交互。 例如:智能音箱,智能电视等等。但这类产品的识别率和误唤醒率还需再不断的优化提升,以至于日常生活中人们还是离不开各式各样的遥控器。而蓝牙语音遥控器这一产品,作为远场语音交互的一个近场配件,也搭上了这趟语音交互的快速列车,成长速度令人惊讶。基于Actions炬芯的ATB1103芯片的语音遥控器,打造了一个AIoT时代的高性价比精品。 遥控器总体架构分四层,从上到下依次为应用层、应用框架层、硬件抽象层、底层驱动层: 场景应用图产品实体图展示板照片方案来源于大大通
2021-04-20 12:03:06 4.30MB 遥控器 炬芯ATB1103 AI语音交互 电路方案
1
科大讯飞AIUI模块串口开发指南.pdf
2021-04-13 09:04:14 981KB AIUI 语音交互
1
LDV7语音识别模块--口令模式+IO口控制
1
使用stm32f103c8t6平台移植基于SPI通信的LD3320语音控制功能。 接线说明: SPI MODE 2, CPOL = 1, CPHA = 0 (STM32CubeMx, Clock Polarity(CPOL) = High, Clock Phase(CPHA) = 1 Edge, Prescaler(for Baud Rate) = 256) SPI MODE Baud Rate need to less than 1.5MHZ GPIO STM32F103C8T6 : LD3320 (MD to 3.3V) PA5 : SCK PA6 : MISO(MI) PA7 : MOSI(MO) PB0 : CS PB1 : RST PB10 : IRQ OTHER LD3320 MD : 3.3V LD3320 WR : GND PA9 : UART TX PA10 : UART RX
2021-03-15 13:49:25 6.98MB stm32f103c8t6 ld3320 spi 语音交互
1