2021-GAIIC-Task3-Share
全球人工智能技术创新大赛-赛道三:小布助手对话短文本语义匹配
周周星分享
非常荣幸能够拿到周周星,目前初赛第四,本着互联网开源精神,这里也做一些的分享,和大家相互学习,共同进步。
数据
1,对偶数据增强,即Q1-Q2对变成Q2-Q1对; 2,闭包数据增强,即Q1-Q2 = 1,Q2-Q3 = 1,则Q1-Q3 = 1;注意:数据增强时要保证正负样本比例,与原始分布一致,否则无效果甚至导致效果变差。
模型训练方式
半互动
1,ESIM,2,Bimpm,3,SentenceBert,注意:半交互是我们一开始的思路,并使用双路bert,上层使用bert前模型等;并且使用ESIM单模加上技巧,单模也可以上0.89,但是后面使用全交互,效果更好,就没有再继续实验了。
全互动
1,先MLM预训练,再微调; 2,MLM预训练与微调一起做,注意:第二种方式会比
2021-09-20 00:03:59
125KB
1