chinese_abstractive_corpus:教育行业新闻 自动文摘 语料库 自动摘要-源码

上传者: 42106357 | 上传时间: 2021-07-13 21:39:00 | 文件大小: 59.81MB | 文件类型: ZIP
chinese_abstractive_corpus 语料名称 教育培训行业抽象式自动摘要中文语料库 语料简介 自动文摘分为两种: 抽取式 抽象式 语料库收集了教育培训行业主流垂直媒体的历史文章(截止到2018年6月5日)大约24500条数据集。主要是为训练抽象式模型而整理,每条数据有summary(摘要)和text(正文),两个字段,Summary字段均为作者标注。 压缩包大约 60 MB,解压后大约 150 MB。 格式如下: summary{{...}} text{{...}} 关于和抽象式自动文摘更多研究成果可参考: 作者对两种文摘方式做了深入对比,并且提供了实验结论。 关于训练集和测试集 并未明确划分训练集和测试集合,请使用者根据自己的实际情况按照比例划分 作者联系方式 wechat : wonderfulcorporation

文件下载

资源详情

[{"title":"( 3 个子文件 59.81MB ) chinese_abstractive_corpus:教育行业新闻 自动文摘 语料库 自动摘要-源码","children":[{"title":"chinese_abstractive_corpus-master","children":[{"title":"res","children":[{"title":"sample.png <span style='color:#111;'> 1.33MB </span>","children":null,"spread":false}],"spread":true},{"title":"README.md <span style='color:#111;'> 979B </span>","children":null,"spread":false},{"title":"corpus.tar.gz <span style='color:#111;'> 58.50MB </span>","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明