基于Pytorch的中文文本摘要生成
开这个仓库的主要目的是记录一下自己实验过程和数据。
参考文本摘要领域大佬写的两篇论文: and ,然后参考另一位大佬修改的代码.
另外,在这里还是要感谢一下。这里的所有内容基本上没做什么修改(python读取文件的时候出现编码问题,我的猜想是大佬用的mac系统,类linux,所以对编码不敏感,我用windows的话就报错了。),最多修改了一下超参数,刚开始在自己windows笔记本上跑的话,确实有点吃力,设置的batch_size=10,好像后来还直接报cuda错误,我的猜想就是设置过大了,显存承受不了。说多了。直接看训练和测试效果吧。
实验结果
指标
验证集
测试集
ROUGE-1
34.06
31.87
ROUGE-2
16.46
15.47
ROUGE-L
33.83
30.93
0. 数据预处理
下载(提取码:g8c6 ),下载完之后放在根目
2021-06-27 09:50:04
8.84MB
Python
1