本次实验是基于词袋模型的图像分类技术,利用提取的局部区域的分布对图像进行识别。在图像分类中,词袋模型算法需要通过监督或非监督的学习来获得视觉词典。基于词袋模型的图像分类算法一般分为四步,首先对图像进行局部特征向量的提取(本次实验采用HOG);其次利用上一步得到的特征向量集,抽取其中有代表性的向量,作为单词,形成视觉词典(本实验采用K-means聚类算法);然后对图像进行视觉单词的统计,一般判断图像的局部区域和某一单词的相似性是否超过某一阈值,这样即可将图像表示成单词的分布,即完成了图像的表示;最后设计并训练分类器,利用图像中单词的分布进行图像分类(本实验采用KNN分类算法和线性SVM多分类算法)。
2021-05-20 17:38:01 90.19MB 计算机视觉 高级计算机视觉
1
一个是jian xiao的Notes on Pattern Recognition and Machine Learning (Bishop),一个是prml读书会的讲义。都是学习prml的资料
2021-05-19 11:18:11 760KB prml
1
Recurrent neural networks (RNNs) are a powerful model for sequential data. End-to-end training methods such as Connectionist Temporal Classification make it possible to train RNNs for sequence labelling problems where the input-output alignment is unknown. The combination of these methods with the Long Short-term Memory RNN architecture has proved particularly fruitful, delivering state-of-the-art results in cursive handwriting recognition. However RNN performance in speech recognition has so far been disappointing, with better results returned by deep feedforward networks. This paper investigates deep recurrent neural networks, which combine the multiple levels of representation that have proved so effective in deep networks with the flexible use of long range context that empowers RNNs. When trained end-to-end with suitable regularisation, we find that deep Long Short-term Memory RNNs achieve a test set error of 17.7% on the TIMIT phoneme recognition benchmark, which to our knowledge is the best recorded score.
2021-05-19 09:53:14 413KB 学术论文
1
循环神经网络在语音识别中的应用 LSTM 双向RNN 双向lstm
2021-05-19 09:43:54 436KB 语音识别
1
这篇论文 主要是结合着源码来看的 非常的好 虽然我也没有看 不过看评论特别好 外国人写的还是比国内写的水平高多了
2021-05-18 11:14:38 2.54MB 虹膜识别
1
这篇论文是近几年表情识别方向的一篇较好的综述。 论文对表情识别的相关信息进行了全面的总结,其中包括对FER相关的数据集介绍、对基于深度神经网络的静态图片和动态图片序列(视频)FER相关算法的优缺点总计,以及对FER面临的机遇和挑战给出了说明。
2021-05-17 16:01:09 3.69MB 深度学习 FER
1
视觉变形金刚 在PyTorch中实现,这是一种使用变压器样式编码器在视觉分类中实现SOTA的新模型。相关文章。 特征 香草维生素 混合ViT(支持BiTResNets作为骨干网) 混合ViT(支持AxialResNets作为骨干网) 训练脚本 去做: 训练脚本 支持线性衰减 正确的超级参数 全轴向ViT Imagenet-1K和Imagenet-21K的结果 安装 创建环境: conda env create -f environment.yml 准备数据集: mkdir data cd data ln -s path/to/dataset imagenet 运行脚本 对于非分布式培训: python train.py --model ViT --name vit_logs 对于分布式培训: CUDA_VISIBLE_DEVICES=0,1,2,3 python dist_tra
1
Traffic Lights Recognition (TLR) Lara_UrbSeq1_CAOR_v3_7_LR.avi Lara_UrbSeq1_CAOR_v3_7_HR.avi
2021-05-12 23:20:08 245.22MB 数据集
1
室内HIIT动作识别项目说明 山东大学(威海) 18数据科学孙易泽 本项目为通过微信小程序进行动作的识别,项目拾取了徒手侧平举,前后交叉小跳,开合跳,半蹲四个动作,在测试者左手手持手机的情况下,利用微信小程序实时采集手机的六轴数据,并用随机森林模型和波峰检测法,对测试者做出的动作进行实时的识别和计数。 以下说明,为项目文件中各个文件夹的相关说明 python项目 数据文件夹:训练所用数据,处理之后的数据 进程文件夹:预数据代码,包括信号处理与窗口切割数据 功能文件夹:特征提取以及特征选取相关代码 machineLearning文件夹:各个算法测试比对,算法的优化与提升 numcount文件夹:动作计数相关代码测试 Web文件夹:服务器部署代码 IndoorHIIT.ipynb:python完整的工程说明文档,可在工程中直接查看,或访问以下网址: 微信小程序 小程序已发布,二维码如下: 完
2021-05-12 07:26:02 31.03MB 系统开源
1
基于Tensorflow 深度学习的手势识别,人机交互
2021-05-11 22:06:08 594.15MB 手势识别 人机交互 tensorflow 深度学习