PFR语料库,有词语切分和词性标注,严格按照人民日报的日期、 版序、文章顺序编排。做NLP非常好的一份资源。
2019-12-21 20:21:56 16.52MB 语料库
1
人民日报语料库,适合机器学习训练使用,分词等。
2019-12-21 19:51:35 17.65MB 语料
1
1998年1月-6月人民日报语料库,已做词性标记,适用于自然语言处理序列标注等任务,如命名实体识别等,里面包含6个月份
2019-12-21 18:58:10 11.5MB 文本分类语料
1
用于HMM中文分词训练,代码可以参见:https://blog.csdn.net/qq_38593211/article/details/81637029
2019-12-21 18:53:49 16.62MB NLP NER
1
仅供学习和研究使用,禁止用于商业行为
2019-12-21 18:53:29 4.64MB 中文分词
1
人民日报2014语料库, 文件多且大所以整合成了压缩包,需要的下载后解压即可
2019-12-21 18:49:39 38.23MB 人民日报 NLP 语料库
1
网上流传的人民日报1998年1月份的语料库,北京大学开发;处理成了crf分词训练语料的格式;
2015-12-03 00:00:00 2.32MB 语料库 中文分词 人民日报 crf
1