seq2seq_Pointer_Generator_Summarizer
一个用于深度抽象摘要项目的深度学习神经网络:这是一个从中文对话中生成摘要总结的项目。有趣的对话是客户和汽车技术人员之间的对话,其中有80000多个样本用于培训和测试,还有20000样本用于预测。数据基准线在某种程度上对于中文是典型的,清除数据-段-标记化-批处理。但是,处理长时间的对话并向word2vec模型添加特殊令牌是很棘手的。通过重新训练模型将特殊令牌添加到w2v模型。
还提供了原始数据集,细分数据集,w2v模型之类的文件以供立即测试。请注意,嵌入矩阵文件太大,无法上传。
在此项目中,您可以:训练模型,测试模型或评估模型:一切都是经典的并使用tensorflow 2.0构建,单词嵌入由word2vec进行预训练,并且seq2seq包括Gru作为编码器,Bahdanau注意和单向Gru作为解码器。该模型还包含指针
2022-03-04 09:28:16
16.28MB
Python
1