格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas
2021-12-20 18:45:07 2.9MB 分词 词库
1
jieba百度分词词库 共63万+条数据
2021-12-17 17:45:53 2.51MB 分词词库
1
jieba与百度的分词词库整合,加入了少量汽车行业的词语,剔除重复项之后剩余630406个词语。
2021-12-01 12:38:43 6.56MB jieba 百度 分词 NLP
1
中文分词词库,较全,适合做搜索,输入法等程式
2021-11-27 22:10:06 4.09MB 分词 词库
1
来源于淘宝搜索数据,网络购物必备词库 电子商务建站必备,分词词库
2021-11-27 10:19:14 290KB 淘宝分词词库
1
298032条中文分词词库,分词专用词性词频,mdb格式,直接可导入的数据库,格式为id 自增序号、key 中文分词、att词性、num词的频率,用office Access 打开
2021-11-26 18:35:49 14.22MB 中文分词词库
1
格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas
2021-11-26 18:14:10 2.9MB 分词 词库
1
格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas%B7%D6%B4%CA/index/1 自己做毕设整理的分词词库,使用中科院的标注集合北大标注集,也就是两种标注混合用的。每个词一个词性,也有词频。由于使用多个词典整合的,词频不是特别准。但是能满足一般的需求。 容量为29.8w. 包含了三级地名、名胜、重要山川河流、一万左右的成语。由于一部分词来自搜狗互联网词库,有些词明显是拼写时常连着拼而不是词。对词库要求高的用户需要另寻良方。 推荐一个对我做分词帮助很大的网站 www.52nlp.cn
2021-11-19 15:22:05 2.9MB 分词 词库
1
15万条词语, 对需要做搜索的人会有一定帮助。
2021-10-27 17:26:14 1.2MB 中分分词 词库 下载
1
数据挖掘资源:可以用于中文分词的百度中文分词词库
2021-10-25 20:17:21 776KB 中文分词
1