solr配置用到的IKAnalyzer分析器所需要的jar包及配置文件
2019-12-21 22:04:08 1.12MB IKAnalyzer
1
使用R语言中的jiebaR包,对中文文本进行分词,求词频,做词云图并进行LDA主题建模。
2019-12-21 21:43:48 14KB jiebaR,LDA
1
含有43万条非重复语料
2019-12-21 21:36:00 4.46MB 中分文分词 词典
1
用于中文文本分词,去停用词,包含基本的停用词词典,可根据需要进行扩充。
2019-12-21 21:27:47 7KB 中文分词 去停用词
1
IKAnalyzer2012.jar,无私免费贡献
2019-12-21 21:27:18 1.12MB 中文分词
1
中文分词器 mmseg4j luncene5.X 源码 jar包
2019-12-21 21:25:58 63KB 中文分词器 mmseg4j luncene5.X
1
solr4.10使用的中文分词器,包括IKAnalyzer2012FF_u1.jar,IKAnalyzer.cfg.xml,stopword.dic,及Cloudera平台下安装solr分词器教程
2019-12-21 21:21:03 398KB 中文分词
1
IK中文分词器 里面含有配置文件和jar包等全面的文件。
2019-12-21 21:19:42 1.12MB IK分词器 中文分词器 ikanalyzer
1
拼音加加中文词库以及各行业扩充词库(txt中文分词字典)
2019-12-21 21:17:37 1.78MB 中文词库
1
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;这个是java版本
2019-12-21 21:15:10 3.8MB 中文分词 关键词提取
1