中文分词词库,中文词库20万(19万6千),自己整理的,用于做中文分词,根据一段话,或者一篇文章进行拆词都可以使用的上。
2023-05-11 22:56:04 2.22MB 中文词库 中文分词 分词词库
1
中文分词 综合词库 更新至2014-03-11
2022-07-17 23:31:57 3.58MB 中文分词 词库
1
中文医学分词词典,结合了网上的资源以及清华的医学分词词库,然后进行去重之后得到的42万个词语组成的医学分词词库,虽然其中含有人名公司名等,但是并不影响具体的使用,本人已经用于具体的业务,确定是没有什么大问题的,中文医学领域的分词效果还不错的。
1
ik中文分词词库35万中文分词词库(含电商)
1
文件内包含 jieba 百度60万+分词词库(带词性权重和不带词性权重的文件各一份),附带停用词词库,词性和权重由机器学习等技术手段生成,持续优化中,欢迎私信提供宝贵意见。
2021-12-27 16:04:54 5.78MB python nlp jieba 分词
格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas
2021-12-20 18:45:07 2.9MB 分词 词库
1
中文分词词库,较全,适合做搜索,输入法等程式
2021-11-27 22:10:06 4.09MB 分词 词库
1
298032条中文分词词库,分词专用词性词频,mdb格式,直接可导入的数据库,格式为id 自增序号、key 中文分词、att词性、num词的频率,用office Access 打开
2021-11-26 18:35:49 14.22MB 中文分词词库
1
格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas
2021-11-26 18:14:10 2.9MB 分词 词库
1
格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas%B7%D6%B4%CA/index/1 自己做毕设整理的分词词库,使用中科院的标注集合北大标注集,也就是两种标注混合用的。每个词一个词性,也有词频。由于使用多个词典整合的,词频不是特别准。但是能满足一般的需求。 容量为29.8w. 包含了三级地名、名胜、重要山川河流、一万左右的成语。由于一部分词来自搜狗互联网词库,有些词明显是拼写时常连着拼而不是词。对词库要求高的用户需要另寻良方。 推荐一个对我做分词帮助很大的网站 www.52nlp.cn
2021-11-19 15:22:05 2.9MB 分词 词库
1