中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
1
公开课资源对应的字幕整理,可用于自然语言处理的语料文本。
2021-10-02 08:58:02 536KB 自然语言处理 文本语料
1
事件抽取 事件关系抽取 数据集 包含部分ACE 2005 Multilingual Training Corpus 和 Text Analysis Conference Knowledge Base Population (TAC KBP)的语料
2021-09-29 16:52:25 3.49MB ACE2005 TAC KBP 事件抽取语料 TEACED
1
Chinese_medical_NLP 医疗NLP领域(主要关注中文) 评测数据集 与 论文等相关资源。 9.CHIP2020各项评测已开放 10.医学数据挖掘与算法评测大赛 11.中文医疗对话数据集 12.阿里发布的中文医疗标准数据集合 中文医学知识图谱 CMeKG 英文数据集 PubMedQA: A Dataset for Biomedical Research Question Answering COMETA: A Corpus for Medical Entity Linking in the Social Media MedMentions 相关论文 1.医疗领域预训练embedding 2.综述类文章 3.电子病历相关文章 4.医学关系抽取 5.医学知识图谱 6.辅助诊断 7.ACL2020医学领域相关论文列表 8.医疗实体Linking(标准化) 9. AAAI2020
2021-09-29 09:36:37 25KB
1
transformer_news:基于transformer的中英文平行语料翻译系统
2021-09-28 17:19:16 25.38MB 系统开源
1
微博情感分析语料集,适用于做NLP情感分析
2021-09-28 17:08:43 2.46MB 微博情感分析语料集 情感分析
50万条中文闲聊对话高质量语料,最新整理,包括很多热门语句和流行词汇。适用于NLP(自然语言处理)进行对话学习训练,可用于聊天机器人研究和开发。
2021-09-27 10:19:15 29.18MB NLP 语料 聊天 机器学习
1
对话机器人训练语料、机器学习、自然语言处理用
1
机器学习、机器翻译训练语料 、未处理、获取前两列对话即可
2021-09-24 15:06:06 3.59MB 机器翻译训练语料 机器学习
1
人民日报语料库 人民日报语料
2021-09-20 15:41:10 3.02MB NLP 自然语言处理 语料
1