使用 PyTorch 框架使用 CRNN 和 CTC 损失进行多位序列识别 训练结果 测试结果
2021-11-22 10:16:59 379KB pytorch ctc-loss crnn sequence-recongnition
1
该论文运用的卷积神经网络(CNN)和LSTM,其中CNN处理频率和空间信息,LSTM处理从CNN输出中提取时间相关性,并将两种模型进行融合。数据集采用的是脑电研究中最常用的DEAP和SEED数据集并且在两个数据集中都取得了很高的准确率。都达到了92%左右的准确率。 论文设计了一种新模型,称为四维卷积递归神经网络。该模型将多通道脑电信号的频域特征、时域特征和空间特征(频率、空间和时间信息)集成在一起,用来提高脑电情绪识别的准确率。首先,提取脑电的这三种特征,我们将不同通道的差分熵特征转换为4维结构来训练深层模型。然后,介绍了卷积神经网络(CNN)和长短时记忆(LSTM)单元的递归神经网络相结合的CRNN模型。CNN用于从4D输入的每个时间片中学习频率和空间信息,LSTM用于从CNN输出中提取时间相关性。LSTM最后一个节点的输出执行分类。该模型在受试者内部划分的SEED和DEAP数据集上都达到了最先进的性能。实验结果表明,结合脑电频域特征、时域特征和空间域特征(频率、空间和时间信息)进行脑电情感识别是有效的。
2021-11-16 14:10:49 1.77MB 脑电情绪识别 DEAP SEED CNN
English | 介绍 PaddleOCR旨在创建多语言,出色,领先和实用的OCR工具,以帮助用户训练更好的模型并将其应用于实践。 注意 PaddleOCR支持动态图和静态图编程范例 动态图:dygraph分支(默认),受桨2.0.0支持() 静态图:开发分支 最近更新 2021.1.21更新了超过25种以上的多语言识别模型的,包括:英语,中文,德语,法语,日语,西班牙语,葡萄牙语,俄罗斯,阿拉伯语等。 更多语言的模型将继续更新 。 2020.12.15更新了数据合成工具,即 ,易于合成与目标场景图像相似的大量图像。 2020.11.25更新新的数据注释工具 ,这有助于提高标记效率。 此外,标记结果可直接用于PP-OCR系统的培训。 2020.9.22更新PP-OCR技术文章 产品特点 PPOCR系列高质量的预训练模型,可媲美商业效果 超轻量ppocr_mobile系列模型:检测
2021-11-06 18:41:13 51.91MB ocr db crnn ocrlite
1
深度学习应用在字符识别中,有demo,也有训练代码,支持中文英文的训练,rcnn经典算法,模型小速度快
2021-11-02 11:43:26 69KB 深度学习 字符识别 cnn
1
基于pytorch的OCR库 这里会有这个项目的代码详解和我的一些ocr经验和心得,我会慢慢更新,有兴趣可以看看,希望可以帮到新接触ocr的童鞋 最近跟新: 2021.05.01 更新CRNN 训练,解决了多gpu训练问题,更换成lmdb训练,需要将图片先转成lmdb(在script文件夹中有多进程将图片转成lmdb的代码),做了一些训练优化,模型结构更改(训练时使用名字中带lmdb的yaml文件),实际训练效果如下表。 2021.03.26 更新CRNN 训练效果,代码整理后上传 2021.03.06 更新CRNN backbone resnet 和 mobilev3 以及配置文件 2020.12.22 更新CRNN+CTCLoss+CenterLoss训练 2020.09.18 更新文本检测说明文档 2020.09.12 更新DB,pse,pan,sast,crnn训练测试代码和预训练
2021-11-01 22:23:31 3.26MB ocr textrecognition sast crnn
1
crnn_ctc-centerloss 2020.12.27更新 使用最后一层全连接层输入的功能作为处理对象,即缩小这一功能的类内距离 实现功能和标签的对齐,主要解决了预测重复,预测漏字时的对齐问题(需要tf1.15) 增加对关键指标的计算和追踪,训练过程更直观,方便debug(需要tf1.15) 中心之间的距离 字符距离自己中心,形近字中心的距离 经过训练,字符距离差增大,预测置信度和距离差拥有一定相关性 增加feature的可视化,使用tensorboard的嵌入投影仪,方便调试 # 生成 embedding 图 python -m libs.projector --model=your_model_path --file=your_label_file_path --dir=your_log_dir # 启动 tensorboard tensorboard --logdir=you
2021-10-31 19:46:45 2.71MB Python
1
此代码是CRNN模型代码,win10可以运行,本人近期有用过,有需要的可以下载(GitHub不会用),上传给有需要的朋友使用;
2021-10-28 08:57:09 50.36MB pytorch CRNN 文字识别 win10
1
卷积递归神经网络 该软件实现了卷积递归神经网络(CRNN),它结合了CNN,RNN和CTC损失,可用于基于图像的序列识别任务,例如场景文本识别和OCR。 有关详细信息,请参阅我们的论文 。 更新2017年3月14日,一个Docker文件已添加到项目中。 感谢 。 UPDATE 2017年5月1日一PyTorch已作出 。 更新2017年6月19日对于端到端文本检测器+识别器,请通过签出 。 建立 该软件仅在Ubuntu 14.04(x64)上经过测试。 需要启用CUDA的GPU。 要构建项目,请首先安装最新版本的 , 和LMDB。 请分别遵循其安装说明。 在Ubuntu上,可以通过apt-get install liblmdb-dev 。 要构建项目,请转到src/并执行sh build_cpp.sh来构建C ++代码。 如果成功,则应在src/目录中生成一个名为libcrnn.so的文件。 运行演示 演示程序可以在src/demo.lua找到。 在运行演示之前,请从下载预训练的模型。 将下载的模型文件crnn_demo_model.t7放入目录model/crnn_demo/
2021-09-25 15:55:24 67KB machine-learning ocr computer-vision torch7
1
crnn(基于pytorch、python3) 实现不定长中文字符识别-附件资源
2021-09-12 15:42:14 106B
1
行业分类-物理装置-一种基于CRNN算法的发票文件真伪识别方法.zip
2021-08-31 13:06:46 225KB 行业分类-物理装置-一种基于CR