中文分词中常用的停用词StopWords集合。
2021-05-01 17:19:54 8KB 中文分词 停用词
1
贝叶斯分类R语言实现代码,带中文分词,准确率召回率判断
2021-04-28 22:37:56 2KB 贝叶斯 bayes 中文 分词
1
用于中文分词的切分词典,还有词性标注,以这个词典数据库为基础建立文本分类,文本检索或文本过滤可以节省很多时间.很全,强烈推荐
2021-04-28 13:03:24 213KB 分词 数据库 文本分类 文本检索
1
ikanalyzer的6.2.0版本中文分词的依赖的jar包’,自己编译了一遍
2021-04-28 01:32:01 1.11MB java ikanalyzer 中文分词
1
分词词库_中文分词词库最新整理(TXT格式)
2021-04-26 15:48:22 1.44MB 分词词库 结巴分词 中文分词
1
这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。
2021-04-25 09:52:17 40.47MB 分词 词库 中文分词
1
中文分词词库,包含清华词库,360w词库,词库大全,txt格式,含词性、词频
2021-04-24 22:06:31 86.61MB 词库 nlp词库
1
虚词(的,是,标点符号等)统计
2021-04-22 11:20:48 3KB 分词
1
因工作需要,最近在做自然语言处理方面的研究,第一步需要实现中文分词,市面上有许多开源的分词组件,本人使用的是word分词,但这些开源组件中的词库都比较小,因此这段时间主要是在网上爬了各种词库,并通过XX词典校验,挑选在XX词典中收录的(耗费相当多的精力)。此份Trigram
2021-04-21 16:42:05 71.65MB 中文分词 自然语言处理
1
因工作需要,最近在做自然语言处理方面的研究,第一步需要实现中文分词,市面上有许多开源的分词组件,本人使用的是word分词,但这些开源组件中的词库都比较小,因此这段时间主要是在网上爬了各种词库,并通过XX词典校验,挑选在XX词典中收录的(耗费相当多的精力)。此份Bigram
2021-04-21 16:40:53 45.35MB 中文分词 自然语言处理 Bigram
1