只为小站
首页
域名查询
文件下载
登录
Python-基于UniversalTransformerCRF的中文分词和词性标注
Sequence labeling base on universal transformer (Transformer encoder) and CRF; 基于Universal Transformer CRF 的中文分词和词性标注
2021-06-25 15:54:54
97KB
Python开发-自然语言处理
1
分词和词性标注工具,非常好用
很好用的工具,可进行分词和词性标注!!!!!!!!!!!!!!!!!
2021-06-21 15:16:17
3.46MB
分词
词性标注
工具
1
HanLP:中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
HanLP: Han Language Processing | | | | | 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 借助世界上最大的多语种语料库,HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务:分词(粗分、细分2个标准,强制、合并、校正3种)、词性标注(PKU、863、CTB、UD四套词性规范)、命名实体识别(PKU、MSRA、OntoNotes三套规范)、依存句法分析(SD、UD规范)、成分句法分析、语义依存分析(SemEval16、DM、PAS、PSD四套规范)、语义角色标注、词干提取、词法语法特征提取、抽象意义表示(AMR)。 量体裁衣,HanLP提供RESTful和nati
2021-06-09 18:05:08
783KB
nlp
natural-language-processing
text-classification
hanlp
1
分词词库_词性人民日报199801.txt
分词词库_词性人民日报199801.txt
2021-06-08 16:51:53
10.18MB
分词
自然语言处理
词性标注
1
ChineseDic.txt
中文字典,每一行包括两个元素,前面是词语,后面是词性 前几行: 冮,nr 劼人,nr 勍,nr 喆,nr 揳入,v 、,w 。,w ·,w —,w ——,w ———,w ——-,w —0.3,m —0.4%,m —0.8%,m —1·2%,m ……,w ‘,w ’,w ’97中华医药信誉杯奖,nz “,w ”,w 〈,w 民音,nr 〉,w 《,w 《党建》杂志社,nt
2021-06-03 12:37:47
802KB
字典
词性
1
stanford-postagger:用于 Node.js 的斯坦福对数线性词性 (PoS) 标记器-源码
斯坦福大学邮报 用于 Node.js 的器 关于 这是一个用于 Node.js 环境的小型 JavaScript 库,提供了将作为本地后台进程运行并使用前端 JavaScript API 进行查询的可能性。 用它来标记英语、德语、法语、西班牙语、阿拉伯语和中文文本的单词,带有 PoS 标签,如名词、动词、形容词等。 注意 斯坦福 PoS-Tagger 是用编写的,因此这个 Node.js 模块需要在环境中安装一个java可执行文件。 此外,请注意,Stanford PoS-Tagger 是在下获得,而不是本模块的一部分。 它的大小为128 MB,并附带21种型号。 它会在npm install上从其外部源自动下载。 使用此 Node.js 模块的应用程序必须考虑斯坦福 PoS-Tagger 的许可。 模块(LGPL 许可,仅英语), 模块(MIT 许可,仅英语), 模块(AGPL 许可,仅
2021-05-29 12:02:39
10KB
nlp
stanford
pos
tagger
1
360万中文词库+词性+词频
360万中文词库+词性+词频词典结构为:词语\t词性\t词频。 词频是用ansj分词对270G新闻语料进行分词统计词频获得。 本人感觉需要特别说明的是词典整理过程中存在部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb 1、词性nw表示本身不知道是什么词性。 2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。
2021-05-25 21:56:54
28.02MB
中文分词
1
一个好用的英文词性标注工具
An English Part-Of-Speech Tagger with Bidirectional Inference
2021-05-24 09:19:38
6.88MB
词性标注
postagger
1
09 名词性从句-2021年新高考英语二轮复习语法及题型大全.pdf
09 名词性从句-2021年新高考英语二轮复习语法及题型大全
2021-05-14 17:02:52
1.9MB
09名词性从句-2021年新高
中文自动分词和词性标注
本资源包括源代码,ppt,技术报告,能够实现中文的自动分词,词性标注。代码是java编写,用eclipse工具实现。是我们自然语言的课程设计。供大家之用
2021-05-06 09:42:45
7.34MB
中文
自动分词
词性标注
java
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
多智能体的编队控制程序的补充(之前上传少了一个文件)
token登录器.rar
人体姿态检测
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
scratch版 我的世界.sb2
DBSCAN算法Matlab实现
商用密码应用与安全性评估——霍炜.pdf
avantage 软件 xps 处理软件30天后不能使用问题
voc车辆检测数据集(已处理好,可直接训练)
粒子群多无人机协同多任务分配.zip
超大规模集成电路先进光刻理论与应用.pdf
中国地面气候资料日值数据集(V3.0)2010-2019.rar
多机器人编队及避障仿真算法.zip
数字图像处理[冈萨雷斯]
基于hadoop商品推荐系统课程设计
最新下载
Java外挂开发之内存修改程序(含源码)类似CE
TPC-ZK-II集成开发环境
北京理工大学的FPGA讲义,非常全面
JLINKV9 4.95
AFSim软件全套工具集下载
基于动态规划(DP)算法的增程式EV能量管理策略研究(MATLAB编程).rar
STM32F4测频率、占空比工程
stm32实现modbus主机从机功能通信
SOCKET 多线程编程
labview搭建的客户端和服务端
其他资源
UDPClient.aix
KST_Ethernet_KRL_22_zh中文版
番茄病虫害数据集
基于QT的c++画图板程序
数学建模十五个经典数学模型
用于三维重建的脑ct dicom格式
Quectel_Linux_ConnectManager_SR01A01V21.
社团会员管理系统数据库课程设计报告(C#+SQLserver附源码)
基于旅游网站的设计与实现(源码)
decision(修正ajax error)
quartus 15.1 prime standard 破解器
peter fritzson的modelica教材
java语法分析器源代码LL(1)文法
北方交通大学硕士研究生入学考试试题结构力学2003.rar
simple-p5js-游戏-源码
微软分布式机器学习工具包 DMTK 综述 .pdf
NeHe-OpenGL-Qt5-Lesson02_CreatePolygon_islinyoubiao.zip
江南大学《计算机网络》期末考试试题(含答案)(17和18两年).pdf
google_play_services_6587000_r22.zip
EVB_SY8205FCC_LIANG_jason.pdf
Introduction To Automata Theory, Languages, And Computation 3rd
ODAC112021Xcopy for 32位
spooling技术(源代码+word实验报告)
openblas vs2013 x64 库(dll和lib)
Spring MVC实例的简单项目