Lucene中文分词器中的极易分词组件,包含jeasy.analysis.MMAnalyzer,以及依赖包lucene-core-2.4.1.jar!
2019-12-21 18:57:58 1.56MB je-analysis lucene-core
1
Python Jieba中文分词工具实现分词功能,Python Jieba中文分词工具实现分词功能
2019-12-21 18:57:53 126.01MB jieba Python
1
lucene中文分词器Jceseg和IK Analyzer使用示例,lucene5可以使用,本人亲测成功,大家放心用,喜欢lucene的人大家关注我的博客 http://blog.csdn.net/wuyinggui10000/article/category/3173543 大家共同交流,有需要的加群106570134
2019-12-21 18:57:33 33.61MB lucene5 中文分词器 IKAnalyzer Jceseg
1
资料包里面含有完整版的复旦大学语料库,外加上本人针对这个语料库而收集整理的分词表,还包括本人精选10类各100篇,以及对其进行分词后的文件,以及只筛选名词后的文件
2019-12-21 18:57:19 105.44MB 复旦 完整版 语料库 停用词
1
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,在此就不多作介绍了。这是该软件的2015版本,欢迎各位学者下载使用。
2019-12-21 18:56:33 49.06MB ICTCLAS2015
1
代码对10个txt文件进行分词、去除停止词,并提取每个词的tfidf特征值输出
2019-12-21 18:56:12 1.32MB IK分词 tfidf特征
1
大数据时代,中文的语义分析变得非常重要,这是一个可以中文分词的小插件,由武大沈阳教授团队开发的。
2019-12-21 18:56:10 8.61MB rost cm
1
java实现中科大ICTCLAS2015分词,源代码和jar包之前都有提供。
2019-12-21 18:56:04 964KB ICTCLAS java
1
百度分词词库,做百度SEO的技术开发,用了它扛扛的,亲,你懂的
2019-12-21 18:55:54 407KB 百度分词词库
1
JAVA版本的比C版本功能更加强大全面!建议大家下载使用,注意请配置WIN32环境下的java
2019-12-21 18:55:34 7.58MB 中科院分词
1