情感识别 使用深度学习和openCV制作的实时情感识别工具。 要求 1)OpenCV 2)火炬 3)法泰 4)Python 3 数据集和模型 如果您想使自己的模型运行make_model.py文件, make_model.py使用的数据集和经过预先训练的模型已上载到make_model.py库中。 笔记 The given model works on `Resnet34` architecture and I have used a pretrained model. 什么是预训练模型? 预先训练的模型先前已在数据集上进行训练,并且包含权重和偏差,这些权重和偏差表示代表其被训练的任何数据集的特征。 学习的功能通常可以转移到不同的数据。 例如,在大型鸟类图像数据集上训练的模型将包含可转让的数据集(例如边缘或水平线)等学习到的特征。 为什么要使用预训练模型? 预训练模型对我
2022-08-10 15:25:53 3.02MB Python
1
Mask-Face-Recognition:口罩人脸识别 ●该项目主要是实现人脸特征向量的提取。以标准人脸识别模型FaceNet为主线,添加fpn_face_attention结构,增加CBAM模块,可以更好地聚焦于人面部半部,没带口罩的区域 整理数据集 正常人脸训练数据:VGGFace2,链接: ://www.robots.ox.ac.uk/~vgg/data/vgg_face2/正常人脸测试数据:LFW(狂野标签脸),链接: : pair.txt: ://vis-www.cs.umass.edu/lfw/pairs.txt(pairs.txt文件是图片对文件,包含测试的图片对,以及标注) 首先生成一个数据集文件夹,把VGGFace2的原始数据(VGGFace2_train文件),LFW原始数据(lfw_funneled),LFW耦合文件(LFW_pairs.txt),都放到数据
2022-08-08 21:29:57 894KB Python
1
matlab人脸匹配代码人脸识别 该项目是为计算机视觉课程开发的,包括两种不同的面部识别方法。 要求 -经过测试 MATLAB @tensorflow/tfjs-node需要Python 2.7 跑步 注意:该代码可能还需要更改才能在Windows计算机上运行。 npm install下载必要的模块。 由于MATLAB会覆盖路径,因此请首先设置节点路径: setenv('PATH', [getenv('PATH') ':/path/to/node/bin']); 例如setenv('PATH', [getenv('PATH') ':/Users/rudotriton/.nvm/versions/node/v14.2.0/bin']); 对于Windows,代码中的dir调用可能需要替换为ls 。 该代码还使用返回的结构的.name字段。 ls可能返回具有不同属性的结构,在这种情况下, folder.name可能不可用,需要更改。 Evaluation.m是运行和评估每种方法的主文件:模板匹配,特征面和神经网络。 培训数据应位于以下位置: ./FaceDatabase/Train/<la
2022-08-06 11:45:38 7.79MB 系统开源
1
Speech Recognition System 语音识别插件,不需要互联网连接; 语音识别质量高、速度快; 支持24种语言; 跨平台(Windows, iOS, Android, macOS, Linux); 易于整合。支持语言: 英语、印度英语、中国、俄罗斯、法国、德国、西班牙、葡萄牙、希腊、土耳其、越南、意大利、荷兰、加泰罗尼亚、阿拉伯语、波斯语、菲律宾、哈萨克斯坦、瑞典、日本、乌克兰、捷克、印地语、波兰
2022-08-04 16:05:23 84.31MB unity3d SpeechRecogniti 离线语言识别
1
英文版和中文版的PRML电子书以及对应的matlab代码,清晰。希望可以帮到需要的人,当然我也是需要积分帮助的人哈哈哈,大家加油吧!
2022-08-01 17:20:17 25.36MB 机器学习 matlab
1
Kaldi GStreamer服务器 这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。 广告 塔林工业大学正在寻找一名从事语音识别的博士生,重点是轻度代码转换的语音(例如,芬兰语包含很多英语技术术语)。 。 注意! 该职位仍然开放! 特征 基于websocket的全双工通信:语音进入,出现部分假设(考虑Android的语音输入) 高度可扩展:服务器由主组件和工作程序组成; 每个并发识别会话需要一名工作人员; 可以独立于远程计算机上的主机启动和停止工作程序 可以进行语音分割,即,基于静音,将长语音信号分为较短的片段 支持任意长的语音输入(例如,您可以将实时语音流式传输到其中) 支持Kaldi的GMM​​和“在线DNN”模型 支持使用大型语言模型对识别格进行记录 支持在请求之间保留声学模型自适应状态 支持无限制的音频编解码器集(实际上
2022-07-27 16:06:16 233.98MB speech-recognition Python
1
ISIC 2018:黑色素瘤检测的皮肤病变分析 概括 更新:2018年7月15日,包括k倍验证以及验证/测试预测和提交。 该存储库为基于Keras / Tensorflow的ISIC-2018挑战的任务1和任务3提供了一个起始解决方案。 当前达到的性能是: 任务1 任务3 平均Jaccard的81.5% 准确度达83% 阈值Jaccard的77.2% 平均召回率68.5% 我们支持Keras支持的大多数骨干网(Inception,Densenet,VGG等)。 对于分段问题,我们还支持在U-Net类型结构中使用Keras预训练主干。 该代码是高度可配置的,允许您更改和尝试算法的许多方面。 下面,我们描述如何运行基准解决方案。 安装/设置 该代码使用:Python 3.5,Keras 2.1.6和TensorFlow 1.8.0。 请参阅需求文件以获取所需的软件包。 请
1
对象识别和机器学习的工具包,内涵大量相应的函数代码,以及demo,并附带使用说明
2022-07-25 15:34:59 94KB 对象识别 机器学习 工具箱
1
基于卷积神经网络实现的面部表情识别项目。采用卷积神经网络(CNN)来完成特征提取和分类的任务,因为 CNN 是模仿人脑工作并建立卷积神经网络结构模型的著名模型,所以选择卷积神经网络作为构建模型体系结构的基础,最后不断训练,优化,最后达到较准确识别出面部表情的结果。
2022-07-09 09:14:09 5.58MB CNN 人脸识别 表情识别
1
本设计介绍基于数字图像处理的车牌识别系统。本设计主要应用数字图像处理方法进行车牌识别,主要包括图像预处理、车牌定位、倾斜校正、字符分割、字符识别五大模块。在完成车牌识别功能的基础上,本系统进一步加入了形态学操作、边框处理算法,能够在光照变化较大、背景较复杂的实际条件下,提高车牌识别率,同时,本设计添加了语音播报系统,能够对识别过程、识别结果进行语音播报,拓展了系统的功能。经过实际测试,本系统能够很好的完成车牌识别任务,车牌识别成功率达100%。
2022-07-08 14:40:48 5.68MB 车牌识别 语音识别 图像