CDial-GPT:大规模中文短文本对话数据集和中文预训练对话模型

上传者: 42174176 | 上传时间: 2022-11-30 10:21:23 | 文件大小: 715KB | 文件类型: ZIP
CDial GPT 本项目提供了一个大规模中文对话数据集,并提供了在此数据集上的中文对话预训练模型(中文GPT模型),更多信息可参考我们的。 本项目代码修改自 ,使用了HuggingFace Pytorch版的库,可用于预训练与微调。 目录 消息 2021-02-28:一个,欢迎大家提bug和加速优化算法,以及新的清洗功能等等。 2021-01-09:实验室出版新书 ,欢迎大家阅读购买。 2020-11-20:预训练模型新工作 。本工作将词级的语言学知识(包括词性和词的情感极性)。表示模型SentiLARE,欢迎大家使用。 2020-10-18:我们的论文《大规模中文短文本对话数据集》获得了NLPCC2020最佳学生论文奖。 :party_popper: :party_popper: :party_popper: 2020-09-08:感谢所提供的。 2020-09-02:可用加载,感谢苏剑林提供代码。 我们所提供的数据集LCCC(大规模汉语清洁会话

文件下载

资源详情

[{"title":"( 26 个子文件 715KB ) CDial-GPT:大规模中文短文本对话数据集和中文预训练对话模型","children":[{"title":"CDial-GPT-master","children":[{"title":"figures","children":[{"title":"inputs.png <span style='color:#111;'> 5.65KB </span>","children":null,"spread":false}],"spread":true},{"title":"train.py <span style='color:#111;'> 12.95KB </span>","children":null,"spread":false},{"title":"contrib","children":[{"title":"__init__.py <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 244B </span>","children":null,"spread":false},{"title":"dash_app","children":[{"title":"app.py <span style='color:#111;'> 4.27KB </span>","children":null,"spread":false},{"title":"img","children":[{"title":"huazi.PNG <span style='color:#111;'> 43.25KB </span>","children":null,"spread":false},{"title":"baba-1599469001402.PNG <span style='color:#111;'> 44.26KB </span>","children":null,"spread":false},{"title":"shazi.PNG <span style='color:#111;'> 46.62KB </span>","children":null,"spread":false}],"spread":true},{"title":"chat_res.py <span style='color:#111;'> 2.77KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 304B </span>","children":null,"spread":false},{"title":"interact.py <span style='color:#111;'> 7.25KB </span>","children":null,"spread":false}],"spread":true}],"spread":true},{"title":"infer.py <span style='color:#111;'> 7.45KB </span>","children":null,"spread":false},{"title":"requirements.txt <span style='color:#111;'> 104B </span>","children":null,"spread":false},{"title":"config","children":[{"title":"cgpt","children":[{"title":"config.json <span style='color:#111;'> 272B </span>","children":null,"spread":false},{"title":"vocab.txt <span style='color:#111;'> 50.78KB </span>","children":null,"spread":false}],"spread":true},{"title":"bert","children":[{"title":"bert_vocab.txt <span style='color:#111;'> 106.97KB </span>","children":null,"spread":false}],"spread":true}],"spread":true},{"title":"LICENSE <span style='color:#111;'> 1.04KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 30.99KB </span>","children":null,"spread":false},{"title":"od","children":[{"title":"utils","children":[{"title":"data_utils.py <span style='color:#111;'> 638B </span>","children":null,"spread":false}],"spread":true},{"title":"inputters","children":[{"title":"inputter.py <span style='color:#111;'> 4.04KB </span>","children":null,"spread":false},{"title":"dataset_wb.py <span style='color:#111;'> 7.02KB </span>","children":null,"spread":false}],"spread":true}],"spread":true},{"title":"data","children":[{"title":"toy_train.txt <span style='color:#111;'> 786.00KB </span>","children":null,"spread":false},{"title":"toy_data.json <span style='color:#111;'> 272.16KB </span>","children":null,"spread":false},{"title":"toy_valid.txt <span style='color:#111;'> 159.33KB </span>","children":null,"spread":false}],"spread":true},{"title":".gitignore <span style='color:#111;'> 69B </span>","children":null,"spread":false},{"title":"interact.py <span style='color:#111;'> 7.25KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明