cnn_handwriting_chinese_recognition 使用python+flask构建的一个网站,然后从网页的写字到获取鼠标手写的汉字经过转码后传回后台,并通过图片裁​​剪处理之后再进行CNN手写中文识别的模型中进行识别,最后通过PIL将共有50,000多汉字,常用的有3,755个。这里主要对常见的3755个汉字进行识别。 一,数据集 例如:北京邮电大学模式识别实验室发布的数据(HCL2000) ,它是目前最大的脱机手写汉字库,共有1,000个人书写,除了汉字样本库外,还有一个对应的书写者信息库,记录了书写者的年龄,职业,文化程度等信息,用作研究相关影响因素。目前此数据库免费
2021-06-09 23:17:52 24.71MB python flask recognition cnn
1
本数据集仅供个人研究学习使用。 Chinese Scientific Literature Dataset_CSL-master_datasets.txt csl_data.json
2021-06-09 11:02:01 775KB 数据集
1
java版飞机大战源码 awesome-chinese-nlp A curated list of resources for NLP (Natural Language Processing) for Chinese 中文自然语言处理相关资料 图片来自复旦大学邱锡鹏教授 Contents 列表 1. 2. 3. 4. 5. Chinese NLP Toolkits 中文NLP工具 Toolkits 综合NLP工具包 by 清华 (C++/Java/Python) by 中科院 (Java) by 哈工大 (C++) LTP的python封装 by 复旦 (Java) by 百度 Baidu's open-source lexical analysis tool for Chinese, including word segmentation, part-of-speech tagging & named entity recognition. (Java) (Python) 一款轻量级的 NLP 处理套件。 (Python) Python library for processing
2021-06-07 12:02:51 87KB 系统开源
1
C# 9.0中文版 使用文档,是。net程序员 必备手册,感觉有用请给好评
2021-06-07 10:00:11 9.72MB c# 文档 .net
1
中文NER 本项目使用 python 2.7 张量流1.7.0 火炬0.4.0 对命名实体识别不了解的可以先看一下这篇。顺便求star〜 这是最简单的一个命名实体识别BiLSTM + CRF模型。 数据 数据文件夹中有三个开源数据集可以使用,玻森数据( ),1998年人民日报标注数据,MSRA微软亚洲研究院开源数据。其中,boson数据集有6种实体类型,人民日报语料和MSRA一般只提取人名,地名,组织名三种实体类型。 先运行数据中的python文件处理数据,供模型使用。 张量流版 开始训练 使用python train.py开始训练,训练的模型会存到模型文件夹中。 使用预训练的词向量 使
2021-06-05 23:17:56 13.53MB tensorflow pytorch named-entity-recognition chinese
1
中文单词向量 该项目提供了100多个中文单词向量(嵌入),它们经过不同表示(密集和稀疏),上下文特征(单词,ngram,字符等)和语料库的训练。 可以轻松获得具有不同属性的预训练向量,并将其用于下游任务。 此外,我们提供了一个中文类比推理数据集CA8和一个评估工具包,供用户评估其词向量的质量。 参考 如果使用这些嵌入和CA8数据集,请引用该论文。 沉力,赵哲,胡仁芬,李文思,刘涛,杜小勇, ,ACL 2018。 @InProceedings{P18-2023, author = "Li, Shen and Zhao, Zhe and Hu, Renfen and Li, Wensi and Liu, Tao and Du, Xiaoyong", title = "Analogical Reasoning on Chinese M
2021-06-03 19:26:17 354KB word-embeddings embeddings chinese embedding
1
触摸IC规格书
2021-06-03 14:00:45 1.41MB 触摸IC规格书 汇顶
1
pytorch实现的中文bert预训练模型bert-base-chinese,可用于中文短文本分类,问答系统等各种NLP任务(网盘链接)
2021-06-02 15:51:20 233B pytorch bert chinese
1
u8g2_wqy 适合 的中文字体,采用作为源本,提供 12x12、13x13、14x14、15x15 和 16x16 点阵字库。 区别 chinese1、chinese2、chinese3 为 的小字符集。 gb2312 是完整的 字符集。 gb2312a 只有 GB2312 01、02 和 16 到 55 以及部分 08 区的编码。没有包含全角标点符号,如 !,请用半角 ! 代替。 gb2312b 只有 GB2312 01 到 55 的编码,其中 10 到 15 区为空区。比 gb2312a 多一些额外的符号。 字库大小 字体名 字符数 字节 u8g2_font_wqy12_t_chinese1 411 9,491 u8g2_font_wqy12_t_chinese2 574 13,701 u8g2_font_wqy12_t_chinese3 993 25,038 u8g2_fon
2021-06-01 20:22:44 6.77MB arduino-library chinese 附件源码 文章源码
1
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR
2021-06-01 15:40:41 145.67MB data
1