本文件包括:Hanlp.py、Corgi_Demo.py、CorgiHMM.py; 利用cocoNLP的InfoExtra.py 等程序
2024-03-30 13:11:28 27.83MB 人名识别
1
nlp_ner 使用Bi-LSTM和crf来进行人名识别,数据集人民日报98年1月标注数据集,训练:验证:测试为3:1:1 数据说明 原数据文件是/data/rmrb199801.txt data_process.py对文件进行了大量的处理 结果 acc:0.99 f1:0.9
2021-11-13 10:03:59 43.54MB Python
1
mynlp:一个生产级,高性能,预定,可扩展的中文NLP工具包。(中文分词,平均感知机,fastText,拼音,新词发现,分词纠错,BM25,人名识别,命名实体,自定义词典)
2021-10-26 17:08:50 1.16MB nlp segment pinyin fasttext
1
Ansj中文分词 使用帮助 开发文档: , 摘要 这是一个基于n-Gram + CRF + HMM的中文分词的java实现。 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。 目前实现了中文分词,中文姓名识别,用户自定义词典,关键字提取,自动摘要,关键字标记等功能。 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。 专家 org.ansj ansj_seg 5.1.1 调用演示 如果你第一次下载只想测试测试效果可以调用这个简易接口 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ; System.
2021-10-22 13:55:16 24.13MB java nlp chinese ansj
1
标准的分词语料库,也可用作命名实体识别。
2021-04-20 14:17:28 2.73MB 分词 命名实体识别 人名识别 人民日报
1
统计与规则相结合的维吾尔语人名识别方法
2021-03-07 21:04:37 870KB 研究论文
1