Sequence labeling base on universal transformer (Transformer encoder) and CRF; 基于Universal Transformer CRF 的中文分词和词性标注
2021-06-25 15:54:54 97KB Python开发-自然语言处理
1
很好用的工具,可进行分词和词性标注!!!!!!!!!!!!!!!!!
2021-06-21 15:16:17 3.46MB 分词 词性标注 工具
1
HanLP: Han Language Processing | | | | | 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 借助世界上最大的多语种语料库,HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务:分词(粗分、细分2个标准,强制、合并、校正3种)、词性标注(PKU、863、CTB、UD四套词性规范)、命名实体识别(PKU、MSRA、OntoNotes三套规范)、依存句法分析(SD、UD规范)、成分句法分析、语义依存分析(SemEval16、DM、PAS、PSD四套规范)、语义角色标注、词干提取、词法语法特征提取、抽象意义表示(AMR)。 量体裁衣,HanLP提供RESTful和nati
1
分词词库_词性人民日报199801.txt
2021-06-08 16:51:53 10.18MB 分词 自然语言处理 词性标注
1
中文字典,每一行包括两个元素,前面是词语,后面是词性 前几行: 冮,nr 劼人,nr 勍,nr 喆,nr 揳入,v 、,w 。,w ·,w —,w ——,w ———,w ——-,w —0.3,m —0.4%,m —0.8%,m —1·2%,m ……,w ‘,w ’,w ’97中华医药信誉杯奖,nz “,w ”,w 〈,w 民音,nr 〉,w 《,w 《党建》杂志社,nt
2021-06-03 12:37:47 802KB 字典 词性
1
斯坦福大学邮报 用于 Node.js 的器 关于 这是一个用于 Node.js 环境的小型 JavaScript 库,提供了将作为本地后台进程运行并使用前端 JavaScript API 进行查询的可能性。 用它来标记英语、德语、法语、西班牙语、阿拉伯语和中文文本的单词,带有 PoS 标签,如名词、动词、形容词等。 注意 斯坦福 PoS-Tagger 是用编写的,因此这个 Node.js 模块需要在环境中安装一个java可执行文件。 此外,请注意,Stanford PoS-Tagger 是在下获得,而不是本模块的一部分。 它的大小为128 MB,并附带21种型号。 它会在npm install上从其外部源自动下载。 使用此 Node.js 模块的应用程序必须考虑斯坦福 PoS-Tagger 的许可。 模块(LGPL 许可,仅英语), 模块(MIT 许可,仅英语), 模块(AGPL 许可,仅
2021-05-29 12:02:39 10KB nlp stanford pos tagger
1
360万中文词库+词性+词频词典结构为:词语\t词性\t词频。 词频是用ansj分词对270G新闻语料进行分词统计词频获得。 本人感觉需要特别说明的是词典整理过程中存在部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb 1、词性nw表示本身不知道是什么词性。 2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。
2021-05-25 21:56:54 28.02MB 中文分词
1
An English Part-Of-Speech Tagger with Bidirectional Inference
2021-05-24 09:19:38 6.88MB 词性标注 postagger
1
09 名词性从句-2021年新高考英语二轮复习语法及题型大全
2021-05-14 17:02:52 1.9MB 09名词性从句-2021年新高
本资源包括源代码,ppt,技术报告,能够实现中文的自动分词,词性标注。代码是java编写,用eclipse工具实现。是我们自然语言的课程设计。供大家之用
2021-05-06 09:42:45 7.34MB 中文 自动分词 词性标注 java
1