vosk-model-small-cn-0.3 Vosk是一个离线开源语音识别工具。它可以识别16种语言,包括中文。 API接口,让您可以只用几行代码,即可迅速免费调用、体验功能。 目前支持 WAV声音文件格式。 GITHUB 源码: https://github.com/alphacep/vosk-api 模型下载:https://alphacephei.com/vosk/models API调用示例文件: 包含python/nodejs/curl版本(http://www.moneymeeting.club/wp-content/uploads/2020/10/vosk.rar) 我在网页下载了好久,所以分享在这里,应该不会比那里还要慢吧
2024-09-06 22:22:12 31.7MB 语音识别 人工智能
1
基于YoloV5l的面部表情识别模型是一项引人注目的技术发展,它将目标检测与深度学习相结合,旨在实现对人脸图像中不同表情的准确识别。YoloV5l模型以其强大的检测性能和高效的计算能力而著称,为面部表情识别任务提供了出色的基础。 该模型的设计考虑到了人脸表情的多样性和复杂性。人脸表情在微表情、眼部、嘴巴等区域都具有独特的特征,因此模型需要具备出色的特征提取和分类能力。YoloV5l模型通过多层次的卷积神经网络和注意力机制,能够在不同尺度上捕捉人脸图像的细节,从而实现高质量的表情分类。 为了进一步提升面部表情识别模型的性能,我们可以考虑以下扩展和优化: 数据增强:通过旋转、缩放、平移、翻转等数据增强技术,增加训练集的多样性,提高模型的泛化能力,尤其在捕捉微表情时更为重要。 迁移学习:利用预训练的权重,特别是在人脸检测和关键点定位方面的预训练模型,可以加速模型的训练和提升性能。 多任务学习:将人脸表情识别与人脸情感分析、性别识别等任务结合,共享底层特征,提高模型的通用性。 注意力机制:引入注意力机制,使模型能够更关注人脸的关键区域,如眼睛、嘴巴,从而提高表情识别的准确性。 模
2024-04-11 23:50:49 168.83MB 目标检测 深度学习 迁移学习
1
为方便调查宁夏全区荒漠草原植物种类及其分布,需对植物识别方法进行研究。针对YOLO v5s模型参数量大,对复杂背景下的植物不易识别等问题,提出一种复杂背景下植物目标识别轻量化模型YOLO v5s-CBD。改进模型YOLO v5s-CBD在特征提取网络中引入带有Transformer模块的主干网络BoTNet(Bottleneck transformer network),使卷积和自注意力相结合,提高模型的感受野;同时在特征提取网络融入坐标注意力(Coordinate attention,CA),有效捕获通道和位置的关系,提高模型的特征提取能力;引入SIoU函数计算回归损失,解决预测框与真实框不匹配问题;使用深度可分离卷积(Depthwise separable convolution,DSC)减小模型体积。实验结果表明,模型YOLO v5s-CBD在单块Nvidia GTX A5000 GPU 帧率可达140帧/s,模型体积为8.9MB,精确率P为95.1%,召回率R为92.9%,综合评价指标F1为94.0%,平均精度均值mAP为95.7%,在VOC数据集平均精度均值可达80.09%。
2024-03-27 17:29:31 1.44MB 毕业设计 yolo论文 深度学习
1
 在煤矿开采过程中,矿井水害事故频繁发生。为快速准确地找出矿井突水水源,降低矿井突水给煤矿生产带来的危害,以赵各庄矿为例,运用独立性权系数与模糊可变理论相结合的方法,选取了Na+,Ca2+,Mg2+,Cl–,SO2– 4和HCO– 36种水化学指标,对赵各庄矿的20组水样数据进行分析计算。结果表明:独立性权系数–模糊可变理论模型排除了水样中各指标间冗余信息的影响,克服了水样各变量间权重难以确定以及变量对水质影响不均匀的问题,可在一定程度上保证突水水源识别模型的准确度;Cl–权重值远大于其他各项化学指标的权重值,即Cl– 对突水水源的识别结果影响较大;采用本文所建模型判别赵各庄矿的8组测试水样,判别准确率达87.5%,表明该模型在矿井突水水源识别中具有重要参考价值。
2024-02-25 16:51:40 281KB 行业研究
1
开源语音识别模型whisper.cpp库的使用demo
2024-02-19 09:25:34 4.16MB 语音识别 AI
1
500条WAV格式的中文语音数据集,可用于中文语音识别模型的测试集,好的一批
2023-08-14 10:02:25 45.69MB python 数据集 nlp 深度学习
1
图像识别,模型训练
2023-05-16 10:45:05 361.52MB 图像识别 检测
1
车牌检测与识别数据集:包括训练车牌检测模型数据:车牌和非车牌图块大小是136*36。 训练字符识别模型数据: 车牌字符大小是20*20,包括:数字:0~9;字母:A~Z;省市简称:京、津、晋、冀、蒙、辽、吉、黑、沪、苏、浙、皖、闽、赣、鲁、豫、鄂、湘、粤、桂、琼、川、贵、云、藏、陕、甘、青、宁、新、渝, 文章链接:https://tuomasi.blog.csdn.net/article/details/123246627?spm=1001.2014.3001.5502
2023-04-08 10:51:25 83.06MB 车牌
1
21年电赛 智能送药小车 数字识别模型+代码
2023-03-16 10:32:04 1.6MB 数字识别 K210 嵌入式 电子设计竞赛
1
基于CNN训练的一套 "端到端" 的验证码识别模型,使用深度学习+训练数据+大量计算力,纯数字识别率高达 99.99%,数字+字母识别率 96%
1