车辆图像识别 概括 该项目的目标是根据斯坦福大学AI网站( )上预先配置的数据集,按品牌,型号和年份对汽车进行分类。 数据预先设置了所有图像的标签和边框。 将图像调整为边界框尺寸,并保存为原始图像。 通过使用TensorFlow的图像数据生成器将图像转换为像素数据矩阵,使用了卷积神经网络将看不见的验证图像分类为不同的汽车品牌。 从网站上找到的所有数据的总和来看,总共有16,185张图像,分为90/10的训练/测试比率。 像EfficientNet系列和InceptionV3这样的预先训练的模型,以前在'Imagenet'数据集上进行了训练,用于获得〜85%的最终精度。 结果 使用EfficientNetB1的模型格式,其中一部分图层保持在ImageNet数据集上学习的预训练权重,基于CNN模型看不到的图像,预测特定汽车的年份,品牌和模型的准确性达到〜85%。 。 以下是结果和模型的摘要:
2023-01-10 16:05:41 933KB JupyterNotebook
1
手势识别 使用Flex和IMU传感器进行深度学习的手势识别
2023-01-09 11:39:18 2KB
1
cifar_image_recognition 使用带有pytorch的cifar10的图像识别 快速入门指南 在克隆的存储库中,在终端中运行以下命令: $ conda env创建-f environment.yml $ conda激活cifar_env 如果使用pycharm,请在创建的conda env中将解释器设置为python版本,例如: ... / anaconda3 / envs / sheep_env / bin / python 从environment.yml列表添加或删除依赖项时,请运行: $ conda env更新--file environment.yml 二手货源/依赖 待定 系统依赖关系: 待定 去做: 待定
2023-01-08 13:48:06 7KB Python
1
lda分类代码matlab 怎么跑 所有matlab源代码都在代码文件夹中。 代码文件夹还包含一个文件夹images ,其中包含我选择的所有图像(从 1 到 20)以及文件夹me中我自己拍摄的照片。 1. PCA 在code文件夹中,运行 pca() 它将首先加载图像,然后生成 PC。 它将进行 2D 和 3D 可视化并绘制 3 个特征面。 然后它将图像投影到 40、80 和 200 维,并使用最近邻进行分类。 所有步骤都在代码的注释中进行了描述。 2.LDA 在code文件夹中,运行 lda() 它将首先加载图像,然后生成 LDA。 它将进行 2D 和 3D 可视化。 然后它将图像投影到 2、3 和 9 维,并使用最近邻进行分类。 所有步骤都在代码的注释中进行了描述。 3. 支持向量机 在code文件夹中,运行 [acc_origin, acc_80, acc_200] = svm(C) 它将首先加载图像并使用 SVM 进行分类并输出准确率。 然后它将执行 PCA 以获取 PC。 它将使用 PC 将数据投影到 80 维和 200 维。它将使用 SVM 对这些维数为 80 和 200
2023-01-04 20:42:40 6KB 系统开源
1
​ 使用dlib的shape_predictor_68_face_landmarks模型,进行眨眼+张嘴的活体检测。包含face_recognition库各种功能是使用样例 使用dilb、face_recognition库实现,眨眼+张嘴的活体检测、和人脸识别功能。包含摄像头和视频 里面涉及到的 video\face13.mp4 的视频,可以自己录制个视频进行测试,我这边把视频给删除了
1
An Image is worth 16x16 Words: Transformer for image recognition手写笔记
2022-12-31 19:25:24 7.98MB 深度学习 论文阅读笔记
1
本资源是Handbook of Fingerprint Recognition 2nd edition 2009 的电子书,英文版,适用于指纹识别的学习
2022-12-29 20:01:12 37.26MB 指纹识别 第二版
1
虹膜识别经典论文:OSIRIS: An open source iris recognition software
2022-12-25 11:29:25 1.16MB 虹膜 虹膜识别
1
人脸识别模型 该软件包仅包含使用的模型。 有关更多信息,请参见 。 这些模型由( 创建,并在公共领域或CC0 1.0 Universal下获得许可。 请参阅许可。
2022-12-21 17:35:18 95.91MB Makefile
1
动作识别研究 该存储库包含用于动作识别的6种代表性2D和3D方法的一般实现,包括I3D [1],ResNet3D [2],S3D [3],R(2 + 1)D [4],TSN [5]和TAM [ 6]。 这些代码用于我们对动作识别的分析。 陈春福(Richard)Chen *,Rameswar Panda *,Kandan Ramakrishnan,Rogerio Feris,John Cohn,Aude Oliva和Fanquanfu *,“对基于CNN的时空表示进行动作识别的深入分析”。 *:均摊 如果您使用此仓库中的代码和模型,请引用我们的工作。 谢谢! @inproceedings{chen2020deep, title={Deep Analysis of CNN-based Spatio-temporal Representations for Action Recog
2022-12-17 17:17:25 64KB Python
1