仅供学习和研究使用,禁止用于商业行为
2019-12-21 18:53:29 4.64MB 中文分词
1
利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
2019-12-21 18:51:55 173KB ictclas knn struts2 中文分词
1
中文分词用统计词频词典,一词一行,txt文本保存
2019-12-21 18:49:03 2.46MB 中文 分词 词频 词典
1
网上流传的人民日报1998年1月份的语料库,北京大学开发;处理成了crf分词训练语料的格式;
2015-12-03 00:00:00 2.32MB 语料库 中文分词 人民日报 crf
1
基于CRF++的中文分词,包含了数据、CRF++工具、java源码,可以一键执行
2015-07-06 00:00:00 5.25MB CRF 中文分词
1