本项目采用java实现了一个基于隐马尔可夫模型的中文句子词性标注系统,并附有详细的说明文档,对于想了解HMM和词性标注的人都会有很大帮助。
2021-10-27 15:58:48 4.37MB 隐马尔可夫 HMM 词性标注 中文分词
1
作者:刘邵博 版本:v1 此词典为个人综合多本词典整合的一个大词典,词典共有词汇3669216个词汇。 词典结构为:词语\t词性\t词频。 词频是用ansj分词对270G新闻语料进行分词统计词频获得。 本人感觉需要特别说明的是词典整理过程中存在部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb 1、词性nw表示本身不知道是什么词性。 2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。 注:此资源为转载网络资源,我发现其他很多都需要收费,所以免费分享出来!同志们,生产资料共有共享万岁!
2021-10-25 18:09:37 22.96MB 中文 词库 分词词库 中文词库
1
考研狂人考研英语之: 词性分类记忆手册 帮助你快速记忆单词
2021-10-24 20:39:16 177KB 词性 单词 记忆
1
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。
2021-10-22 18:36:57 4.05MB 分词器 nlpir 张华平 词性标注
1
Ansj中文分词 使用帮助 开发文档: , 摘要 这是一个基于n-Gram + CRF + HMM的中文分词的java实现。 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。 目前实现了中文分词,中文姓名识别,用户自定义词典,关键字提取,自动摘要,关键字标记等功能。 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。 专家 org.ansj ansj_seg 5.1.1 调用演示 如果你第一次下载只想测试测试效果可以调用这个简易接口 String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ; System.
2021-10-22 13:55:16 24.13MB java nlp chinese ansj
1
英语词缀词性及其转化.doc
2021-10-19 22:01:54 143KB 文档
基于HMM进行词性标注示例 把/? 这/? 篇/? 报道/? 编辑/? 一/? 下/? 把/q-p-v-n 这/r 篇/q 报道/v-n 编辑/v-n 一/m-c 下/f-q-v
2021-10-19 15:53:23 766KB 隐马尔科夫 自然语言
1
CwsPosNerEntityRecognition 中英文Cws Pos Ner实体识别工具,使用CNN双向lstm和crf模型,并带有char嵌入。基于字向量的CNN池化双向BiLSTM与CRF模型的网络,可能一体化的完成中文和英文分词,词性标注,实体识别。主要包括原始文本数据,数据转换,训练脚本,预训练模型,可用于序列标注研究。注意:唯一需要实现的逻辑是将用户数据转化为序列模型。分词准确率约为93%,词性标注准确率约为90%,实体标注(在本样本上)约为85%。 提示 中文分词,词性标注,实体识别,在使用上述模型时,本质是就是标注问题!!!如果您第一次使用相关的模型,只需加上self.c
2021-10-18 22:10:58 52.4MB nlp tensorflow crf keras
1
https://blog.csdn.net/weixin_43975374/article/details/118969476
2021-10-14 16:16:57 889.69MB 词性 NER
1
自然语言处理 高效的中文词法分析工具包
2021-10-13 10:07:09 50.47MB 安装包 中文分词 词性标注
1