用VB进行的分词实验,包括词频、字频统计
2020-01-03 11:17:59 3.08MB vb 中文分词
1
用C语言编写的源代码. 实现了准确的中文分词.
2020-01-03 11:17:11 5KB 中文分词 分词
1
包含了中文停用词表、百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词库及四个词库整合去重后的汇总停用词库
1
程序用java编写后向算法中文分词分词,并建立倒排索引表。然后在myeclipse下编写一个web形式的搜索测试页。
2019-12-28 17:56:36 2.7MB 倒排索引 搜索引擎 java 中文分词
1
使用keras实现的基于Bi-LSTM CRF的中文分词 词性标注
2019-12-28 17:44:56 113KB Python开发-自然语言处理
1
中文分词词库整理,Ik分词器词库,中文分词词库整理,Ik分词器词库
2019-12-21 22:26:32 7.12MB IKAnalizer ElasticSearc
1
lucene 中文分词小案例,实现中文检索,最近看到lucene顺便自己动手做了一下感觉挺实用的,案例很简单,很容易看懂
2019-12-21 22:22:58 21.15MB lucene java搜索引擎 中文分词
1
包括4款分词工具的最新词库: 1、IK分词:27万词 2、jieba分词:40万词 3、mmseg分词:15万词 4、word分词:64万词
2019-12-21 22:19:38 4.77MB 分词 中文 中文分词 word
1
汇总的中文分词词库,分为两个目录: 1、中文分词词库汇总。包含10个词库,文件名字表示里面词的数量(单位是千),如150.txt,表示包含15万词。 2、主流分词工具的词库。包含word/jieba/mmseg/IK分词工具的最近词库。 注意:分词时,不一定是词库中的词越多,效果越好。
2019-12-21 22:19:38 10.34MB 中文分词 分词 词库 分词词库
1
参考网络资源使用IKAnalyzer分词组件,实现了纯Java语言、MapReduce模式及Spark 框架三种方式对唐诗宋词等国学经典进行中文分词统计排序的功能,你可以轻松发现唐诗宋词中最常用的词是那几个。
2019-12-21 22:08:28 379KB Spark Java MapReduce IKAnalyzer
1