1946年人民日报数据
2021-03-15 18:10:49 4.62MB 数据库 爬虫 人民日报
1
人民日报1953年语料
2021-03-15 18:10:49 17.8MB 人民日报 爬虫 数据库
1
2014年人民日报标注数据,里面包含词性标注,可以用来训练词性标注、分词模型、实体识别模型。
2021-03-12 13:59:19 37.52MB 文本 深度学习
1
微博id 微博正文 原始图片url 发布位置 发布时间 发布工具 点赞数 转发数 评论数
2021-01-30 14:14:29 9.01MB 数据 微博 爬虫 人民日报
1
最权威的中文文本分词语料 可用于文本分词 分词语句达20万句
2021-01-29 20:46:29 12.22MB 1998 人民日报 分词 语料
1
人民日报2014年语料库,2014.1.1至2014年1.23日人民日报语料库。
2019-12-24 03:22:42 82.67MB 语料库
1
人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
2019-12-21 22:05:48 10.18MB 中文语料 标注语料 自然语言处理
1
PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,他们三方计划公开PFR语料库。作为公开的前期工作,从4月3日起,在他们三方的主页上免费公开PFR语料库1月份的语料,欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库,请注明来源。
2019-12-21 21:25:40 19.36MB 数据集
1
处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级
2019-12-21 20:35:50 4.53MB 自然语言处理 命名实体识别
1
人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
2019-12-21 20:28:58 2.12MB 语料库 人民日报 中文分词 语义
1