网上流传的人民日报1998年1月份的语料库,北京大学开发;处理成了crf分词训练语料的格式;
2015-12-03 00:00:00 2.32MB 语料库 中文分词 人民日报 crf
1
基于svm的中文文本自动分类系统的语料库, 包含了17类, 全部都是自己爬的. 详情:http://blog.csdn.net/yinchuandong2/article/details/17717449
2014-07-23 00:00:00 10.19MB 语料库 自动分类 svm
1
搜狗最新文本分类语料库 C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事
1