作者:刘邵博 版本:v1 此词典为个人综合多本词典整合的一个大词典,词典共有词汇3669216个词汇。 词典结构为:词语\t词性\t词频。 词频是用ansj分词对270G新闻语料进行分词统计词频获得。 本人感觉需要特别说明的是词典整理过程中存在部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb 1、词性nw表示本身不知道是什么词性。 2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。 注:此资源为转载网络资源,我发现其他很多都需要收费,所以免费分享出来!同志们,生产资料共有共享万岁!
2021-10-25 18:09:37 22.96MB 中文 词库 分词词库 中文词库
1
电商词库、淘宝、天猫、京东、拼多多各大电商平台搜索词库,分词词库 总共25825条
2021-10-13 18:09:16 302KB 电商 词库 京东 淘宝
1
新版盘古代码+分词词库+分词工具 Pan Gu Segment is a library that can segment Chinese and English words from sentence. 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。
2021-10-13 14:51:35 1.88MB 盘古 分词词库 盘古分词词库
1
词库囊括了各大电商平台搜索词的词库,用于分词,及扩展。
2021-09-23 14:06:04 373KB 电商 词库 京东词库 天猫词库
1
30万 中文分词词库.txt 42537条伪原创词库.txt 百度分词词库.txt 词库地址.txt 词库下载地址.txt
2021-09-01 08:54:32 6.36MB 分词 中文 中文分词
1
因工作需要,最近在做自然语言处理方面的研究,第一步需要实现中文分词,市面上有许多开源的分词组件,本人使用的是word分词,但这些开源组件中的词库都比较小,因此这段时间主要是在网上爬了各种词库,并通过XX词典校验,挑选在XX词典中收录的(耗费相当多的精力)。此份是汇总词库
2021-07-21 13:05:24 37.8MB 分词词库
1
汉语大词库。总量为四十多万个。可以用于jieba等分词模块的分词的时候用。也可以自定义作为专业文档的分词的词典用。
2021-07-19 09:02:33 766KB 词库
1
盘古分词词库
2021-07-12 02:26:33 1.21MB 盘古分词词库
1
16万常用词库,清华大学11种开放词库带词频。可以用于自然语言处理在分词方面的研究学习用。 我是用C++进行分词,使用速度很快,几乎感觉不到查找时间。
2021-07-05 20:24:40 1.75MB 中文分词 词库 带词频
1
分词词库是一个搜索引擎中非常重要的一部分,为基于词典分词的算法提供了分词依据。
2021-06-28 18:28:06 392KB 分词词库
1