基于matlab中文字符的识别
2023-12-10 19:08:14 1.34MB matlab 开发语言
Socket实例 vs2008编写,服务器与客户端支持中文字符发送。 连续监听客户端连接。
2023-11-30 05:02:04 81KB vs2008 Socket
1
运用C++实现中文字符的KMP匹配算法,实现关键字搜索
2022-12-19 21:13:44 1.65MB KMP 中文字符 匹配算法 C++
1
最近应朋友的要求,帮忙做一下本地化的搜索引擎,所以花了点时间探索sphider,刚开始也跟很多网友一样涉及到了字符编码、乱码的问题。可以看到拉丁字符都正常显示而中文字符都是乱码。在我的数据库里使用 utf8_general_ci 编码,所以花了点时间把sphider也做了修改。希望能帮到大家。
2022-10-16 14:35:42 90KB sphider 中文字符编码 不乱码
1
基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别源码+检测数据集,已获高分通过项目。内附文档说明等等资料。 数据集: 共约364万张图片,按照99:1划分成训练集和验证集 数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成 包含汉字、英文字母、数字和标点共5990个字符 人工智能综合实践课程设计工程项目。 本项目基于文本检测,文本识别算法以及Transformer模型和pyttsx3库实现文本识别到翻译再到输出的任务。 基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别 基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别,已获高分通过项目。内附文档说明等等资料。 人工智能综合实践课程设计工程项目。 本项目基于文本检测,文本识别算法以及Transformer模型和pyttsx3库实现文本识别到翻译再到输出的任务。 基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别
压缩包的主要内容: [技巧] 1.增量搜索通过自定义颜色显示 可以在文本中通过增量搜索的方式,把想要查看的多个关键词使用不同的颜色进行高亮处理。 对于阅读分析代码工作特别方便 2.宏录制方法 授之以渔。以一个脚本为范例,讲述如何通过EmEditor创建脚本。大家以后可以按照这个方式快速的编写自己想要的脚本。 [脚本] 可以一键实现EmEditor打开的文件中的中文字符全部替换成对应的英文字符。 方便扩展,大家可以在脚本代码的数组后面加入自己希望替换的字符
2022-06-11 10:44:06 663KB EmEditor 脚本
1
文本字符串编码在 Text、ANSI、Unicode、Unicode Big Endian、UTF-8、 UTF-7 之间的互相转换,转换结果使用十六进制表示。
2022-06-08 13:05:38 99KB 编码转换
1
中文分词C++程序,建立了词典,采用正向匹配算法实现
2022-06-07 20:14:09 1.03MB 中文字符 分词 C++ 最大正向匹配
1
PPOCR源码,百度识别中文开源代码
2022-05-21 11:23:29 55.59MB PPOCR 中文字符识别
1
Online handwritten Chinese text recognition (OHCTR) is a challenging problem as it involves a large-scale character set, ambiguous segmentation, and variable-length input sequences. In this paper, we exploit the outstanding capability of path signature to translate online pen-tip trajectories into informative signature feature maps using a sliding window-based method, successfully capturing the analytic and geometric properties of pen strokes with strong local invariance and robustness. A multi-spatial-context fully convolutional recurrent network (MC-FCRN) is proposed to exploit the multiple spatial contexts from the signature feature maps and generate a prediction sequence while completely avoiding the difficult segmentation problem. Furthermore, an implicit language model is developed to make predictions based on semantic context within a predicting feature sequence, providing a new perspective for incorporating lexicon constraints and prior knowledge about a certain language in the recognition procedure. Experiments on two standard benchmarks, Dataset-CASIA and Dataset-ICDAR, yielded outstanding results, with correct rates of 97.10% and 97.15%, respectively, which are significantly better than the best result reported thus far in the literature.
2022-05-09 01:43:26 332.47MB 深度学习 手写中文字符识别
1