HWDB-1.1 手写汉字CNN识别模型训练 数据集 使用CASIA-HWDB1.1进行训练和测试,训练集和测试集按照4:1划分,测试集235200张,训练集940800张, 共计1,176,000张图像。该数据集由300个人手写而成,其中包含171个阿拉伯数字和特殊符号,3755类GB2312-80 level-1汉字。 样例图 模型训练 Finetuning from a pretrained model 以googlenet为基础模型,进行finetuning。直接训练全部类别无法收敛时,尝试分阶段训练。 训练后的测试结果为loss-1和loss-2分支准确率为95%,loss-3分支为97%。收敛很快,以0.01为基础学习率,32的batch size,不到10000次迭代就收敛了。 Train 'HWDB-CNN-9Layer' model 虽然googlenet效果尚可,但是由
2021-09-17 08:48:58 66KB Python
1
最近想做一个有关人脸识别的项目,想先用face_recognition试试手,毕竟是号称最简单的人脸识别库了,但是在安装的时候会有各种报错,间断性的忙活了两天,终于搞定了,记一篇笔记以供后来者。 首先说一下我的环境,目前我使用的是Anaconda3和pycharm。 主要参考了这篇博文: python—–windows下安装face_recognition库 一、安装visual Studio 首先安装一个VisualStudio,后期编译dlib什么的需要这个环境。 可以通过这个链接直达官网 VIsualStudio官网 在官网点击安装,下下来一个VisualStudio Installer
2021-09-15 17:51:58 641KB ace c ce
1
ESP32-CAM的Alexa人脸识别 基于ESP32-CAM的人脸识别解决方案,可触发Alexa例程。 该存储库的目的是基于ESP32-CAM识别出的人脸来启动Alexa服务中的例程。 它基于此存储库: : 我对代码进行了几处更改: 代码中的其他注释。 在camera_index.h中使用可读HTML / Javascript代码(使更改内容更容易)。 更改了Javascript代码,使其也可以与Safari Web客户端(已删除的音频界面)一起使用。 允许通过和不通过Web套接字连接客户端的情况下进行人脸检测。 添加了根证书和代码以请求每个可识别面Kong的URL。 使用内置的LED来显示是否检测到脸部,并提供额外的光线以更好地进行检测。 封闭的内存泄漏可释放使用的缓冲区。 可在找到有关Espressiv的ESP-Face组件的背景信息。 通常,人脸识别过程
2021-09-13 22:37:38 284KB alexa face-recognition arduino-esp32 esp32-cam
1
人脸识别 这个python程序可以识别你的脸! 该程序只需要每个人的一张照片即可识别他们。 将您的照片添加到“ Images directory或者您可以在PC的任何位置使用any other floders 。 运行main.py文件。 运行main.py ,将要求您输入path 。 您应该输入正确的路径,否则程序将终止。 您使用的图像应具有适当的名称,例如: yourname.jpg/png因为该程序将文件名假定为该person's name 。 如果一切正常,这将打开您的webcam 。 一旦检测到您的脸,就会出现一个绿色的边界框,以及您在jpg / png文件中使用的名称。 此外,您的姓名也会与时间一起显示在终端中。 要停止程序,请在终端中按ctrl+C 可以使用任何中断程序执行的命令。 要求 使用的库: 库是一部分库。 但是某些wheel version需要
2021-09-13 16:56:26 1.53MB Python
1
使用奇异值分解的人脸识别。 该识别算法使用基本对象识别方法,即奇异值分解。 使用SVD函数,您可以训练自己的图像并在该图像上执行SVD,然后可以对SVD函数返回的U(特征脸)向量进行一些数学运算测试。 面部图像的数据集在“ dataimage”中。 该代码显示在face_recognition.py文件中。 测试图像位于test_img文件夹中。达到的准确度为85%。
2021-09-13 10:20:50 280KB python opencv face-recognition svd
1
级联表网 CascadeTabNet:一种从基于图像的文档进行端到端表检测和结构识别的方法 , , , , 该论文在发表(口头)虚拟口头演示 1.简介 CascadTabNet是一种自动的表格识别方法,用于解释文档图像中的表格数据。我们提出了一种改进的基于深度学习的端到端方法,用于解决使用单个卷积神经网络(CNN)模型的表检测和结构识别问题。 CascadeTabNet是基于级联蒙版区域的CNN高分辨率网络(级联蒙版R-CNN HRNet)的模型,该模型检测表的区域并同时从检测到的表中识别结构体单元。我们在ICDAR 2013,ICDAR 2019和TableBank公共数据集上评估结果。我们在ICDAR 2019比赛后结果中排名第三,用于表检测,同时获得ICDAR 2013和TableBank数据集的最佳准确性结果。我们还在ICDAR 2019表格结构识别数据集上获得了最高准确
1
人脸识别与检测 人脸识别与检测。含数据集和源代码。 这里一共包含6个.py文件。 get_my_faces.py调用摄像头获取用户的人脸图片,作为数据存储到my_faces文件夹中去。最终就是要从众多人脸图片中,识别出用户。 set_other_faces.py从人脸数据集中获取图片,进行进行预处理,之后存入other_faces文件夹中去。 Functions.py存储的是处理图片数据时用到的函数,包括getPaddingSize()和readData()。 预先图片的时候,需要放置周围进行填充,调用函数getPaddingSize()可以得到,对于一张图片,上下左右分别需要补充多少行或多少列。 函数readData()从文件夹my_faces和other_faces中读取数据图片,并进行填充,然后添加到imgs列表中去;并根据图片所在的文件夹给图片添加标签,添加到实验室列表中去。
2021-09-12 19:46:05 145KB 系统开源
1
Fundamental of speech recognition是Lawrence Rabiner 和Biing-hwang Juang编写的语音识别方面的权威著作,很经典。
2021-09-12 07:36:00 13.29MB 语音识别
1
Pattern_classification,想学习机器学习和模式识别相关知识可以参考下
2021-09-11 09:34:21 7.98MB machine learning pattern recognition
1
PRML pattern recognition and machine learning (最完整,包括学习笔记,习题答案,中文版,英文版电子档)
2021-09-10 17:52:23 18.77MB 模式识别 机器学习
1