知识驱动对话2019-lic
2019语言与智能技术竞赛B榜第5名方案由于线上部署对时间有要求,最终提交人工评估的版本删除了一些主题特征,导致模型结果有所下降,最终人工评估第9名。A榜第四B榜第五
概述
为了建立主动对话聊天机器人,我们使用了所谓的世代重排方法。 首先,生成模型(Multi-Seq2Seq)产生一些候选答案。 接下来,重新排序模型负责执行查询-答案匹配,以针对所产生的候选者尽可能多地选择答复。 现在可以通过详细的描述我们的解决方案的论文,请检查。
数据扩充
我们使用了四种数据增强技术:实体泛化,知识选择,切换,对话提取来构建用于训练Seq2Seq模型的多个不同数据集。 可以使用脚本Seq2Seq / preclean _ *。py稍加修改参数即可获得6个数据集。
Seq2Seq模型
为了整体目的,我们选择不同的编码器和解码器,即LSTM单元和Transformer。 这部
2022-11-18 09:17:16
37.21MB
系统开源
1