本项目使用 GPT2-Chinese 的模型将wiki中文的数据导入模型训练了通用模型。
将GPT2-chitchat的对话任务稍作修改来适用于中文摘要任务。
将通用模型的权重应用在摘要问题上进行进一步训练的。
GPT2-Chinese 参考:https://github.com/Morizeyao/GPT2-Chinese
GPT2-chitchat参考:https://link.zhihu.com/?target=https%3A//github.com/yangjianxin1/GPT2-chitchat
项目工作流程详见:https://zhuanlan.zhihu.com/p/113869509
本项目为GPT2-chitchat稍作修改的内容,在此也感谢大佬的分享。
由于NLPCC的摘要数据为新闻语料,涉及话题和内容较多,应用在垂直领域下效果会好一些。
1