医学博士 这是以下论文的代码: 刘文革,唐建恒,秦静慧,林旭,李振,梁晓丹; Arxiv 要求 pip install allenlp==0.9 用法 对于主题预测任务(例如,运行LSTM基准): cd topic_predict allennlp train ../config/topic_predict/lstm_baseline.json --include-package basline -s tmp/lstm1 对于响应生成的任务(例如,运行seq2seq基线): cd generation allennlp train ../config/generation/seq2seqattn.json --include-package seq2seq -s tmp/seq2seq1 数据集(仅火车集)
2023-05-08 22:49:12 43KB Python
1
CDial GPT 本项目提供了一个大规模中文对话数据集,并提供了在此数据集上的中文对话预训练模型(中文GPT模型),更多信息可参考我们的。 本项目代码修改自 ,使用了HuggingFace Pytorch版的库,可用于预训练与微调。 目录 消息 2021-02-28:一个,欢迎大家提bug和加速优化算法,以及新的清洗功能等等。 2021-01-09:实验室出版新书 ,欢迎大家阅读购买。 2020-11-20:预训练模型新工作 。本工作将词级的语言学知识(包括词性和词的情感极性)。表示模型SentiLARE,欢迎大家使用。 2020-10-18:我们的论文《大规模中文短文本对话数据集》获得了NLPCC2020最佳学生论文奖。 :party_popper: :party_popper: :party_popper: 2020-09-08:感谢所提供的。 2020-09-02:可用加载,感谢苏剑林提供代码。 我们所提供的数据集LCCC(大规模汉语清洁会话
2022-11-30 10:21:23 715KB dialogue text-generation pytorch gpt
1
chat_corpus对话数据集,适合自然语言处理方向的数据集。
2022-09-08 15:47:42 122.77MB 对话数据集
1
Inspired:电影推荐对话数据集.zip
2022-06-16 11:03:46 8.31MB 生活娱乐 数据集
中文个性情感对话数据集CPED.zip
2022-06-16 11:03:43 3.67MB 数据集
在自然语言处理领域,构建对话系统是一项艰巨的任务,让人类可以与虚拟代理进行自然感觉的对话,这也是许多正在进行的研究的重点。一些挑战包括随着时间的推移将引用链接到相同的实体,跟踪之前的对话中发生了什么,并生成适当的响应。这种自然发生的对话语料库有助于建立和评价对话系统。
2022-05-26 09:43:48 786.42MB 数据集
1
cr:Toyhom 本数据集由Toyhom提供。 LICENSE.txt sample_IM5000-6000.csv chinese medical dialogue_datasets.zip
2022-03-17 12:08:55 139.9MB 数据集
1
会话数据集 用于对话响应选择的大型数据集的集合。 该存储库提供了用于创建可重现的数据集的工具,用于训练和评估会话响应模型。 这包括: -37亿条基于话题对话的评论 电影和电视字幕超过4亿行(提供英语和其他语言) -亚马逊产品中超过360万个问题-答案对 机器学习方法最适合诸如此类的大型数据集。 在PolyAI,我们在庞大的对话数据集上训练对话响应模型,然后将这些模型适应对话AI中特定领域的任务。 在庞大的数据集上对大型模型进行预训练的一般方法在图像社区中早已流行,现在在NLP社区中正在兴起。 除了提供原始处理的数据外,我们还提供脚本和说明来自行生成数据。 这使您可以查看并可能操纵预处
1
新语料.zip nlp, 开放域对话数据集,方便大家做nlp开发,里面包括大量的nlp对话数据集,包括任务型对话,开放域对话,闲聊对话等,方便大家下载使用,与偶语料很充足,做训练集训练模型。
2021-12-01 20:37:31 17.33MB nlp
1
系统Ubuntu对话数据集下载地址 ubuntu对话系统数据集 Ubuntu对话数据集,可以用于多轮对话训练语料库,内附Ubuntu对话数据集的下载地址。智能聊天,chatbot,训练对话的语料库
1