中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过200KB,各种词典数据压缩后不到3M,是当前世界上最好的汉语词法分析器。
2021-10-08 21:45:32 8.66MB 中科院 分词 人工智能 机器学习
1
NLPIR中科院分词系统JAVA项目,包含源代码(只有经典组件),相关的包。许可证会过期,请到官方仓库下载复制到Data目录下。
2021-06-03 17:02:34 16.56MB NLPIR 分词系统 JAVA
1
中科院汉语词法分析系统ICTCLAS安装包的安装包, 破解见我的其他资源
2021-05-22 11:10:29 9.68MB ICTCLAS 中科院,分词系统
1