康奈尔大学的电影对白语料库Cornell Movie-Dialogs Corpus
2022-02-02 10:30:37 9.46MB 深度学习 NLP 数据集
1
情绪急救数据集 心理咨询问答语言料库,仅限研究用途。 为什么发布这个语料库 心理咨询中应用人工智能,是我们认为非常有价值的一个探索。我们愿意和更多人合作,把目前领先的人工智能技术,在心理咨询不同场景定位地。扣门的,就给他开门,愿每个人都有自己的心理咨询师。 - 数据集介绍 心理咨询问答语料库(以下也称为“数据集”,“语料库”)是为应用人工智能技术于心理咨询领域制作的语料。据我们所知,这是心理咨询领域首个开放的QA语料库,包括20,000条心理咨询数据,也是公开的最大的中文心理咨询对话语料。数据集内容丰富,不但存在多轮对话内容,也有分类等信息,制作过程耗费大量时间和收益,标注过程是针对多轮对话的,平均每条标记耗时1分钟。 数据集由斯坦福大学,UCLA和台湾辅仁大学临床心理学等心理学专业人士参与建设,并由Chatopera和众多志愿者合作完成。 数据文件位置 ,该文件为Gzip压缩,utf8
1
该数据集收集了1998年至2007年之间的2500多个“尼日利亚”欺诈信。 fradulent_emails.txt
2022-01-21 16:04:00 5.47MB 数据集
1
用于chatterbot训练自己的聊天机器人人,内含160多万条对话
2022-01-18 22:11:39 58.69MB nlp 人工智能 深度学习 chatterbot
1
业余项目“萌名NameMoe(一个基于语料库技术的取名工具)”的副产品。已开源在某开源网站,但有用户反馈上不去或网速慢下载不了,现转存一份在CSDN。
2022-01-01 21:03:07 17.91MB 自然语言处理 语料库
1
Pytorch实现的流式与非流式语音识别模型(数据集:free_st_chinese_mandarin_corpus),源码地址为:https://github.com/yeyupiaoling/MASR
2021-12-27 10:06:54 505.19MB deepspeech 语音识别 asr pytorch
1
英越双语语料库(EVBCorpus)是英语和越南语平行翻译和bitexts的集合。
2021-12-13 17:56:37 10.9MB 开源软件
1
一个简单的新闻语料库,包含5个类别,每个类别500篇文档。
2021-12-13 17:05:09 3.95MB 自然语言处理
1
matlab仿真代码Binhvq新闻语料库 基本信息: 从包括报纸在内的互联网上约14.896,998篇文章中摘录: 2Sao, ANTG, ANTT, ANTĐ, ATGT, BVPL, BizLIVE, Biên Phòng, Bnews, Báo Văn hóa, Bộ Công thương, Bộ GTVT, Bộ KHĐT, Bộ Ngoại Giao, Bộ Nội Vụ, Bộ Tài Chính, Bộ VHTTDL, CAND, CAĐN, CL&XH, CSTC, Cartimes, Chính Phủ, Công Luận, Công Lý, Công Thương, DNVN, Doanh Nghiệp, Dân Sinh, Dân Việt, Em Đẹp, GD&TĐ, GTVT, Gia Đình Mới, Gia Đình VN, Giao Thông, Giáo Dục VN, GĐ&XH, Hà Nội Mới, Hà Tĩnh, Hải Quan, ICTNews, Infonet, KTNT, KTĐT, Khỏe 365, Khỏe Plus
2021-12-13 16:18:33 87KB 系统开源
1
马来语数据集,我们收集了马来西亚语料库! 该存储库用于存储和。 我们将不断更新此存储库。 我们如何收集数据集? 对于新闻,文章和字幕,我们使用搜寻器,您可以从此处获取代码 。 对于Bahasa,大多数情况下我们使用Google Translator,您可以从此处获取代码 。 使用社交媒体,我们使用爬虫从Twitter,Facebook和Instagram捕获大多数实时数据,因此我们仅使用Elasticsearch查询进行搜索。 对于语音,我们使用Macbook Air 2013附带的有线麦克风进行录制,同时阅读了bahasa维基百科的一些随机文本。 我们请一些语言学家来监督。 词汇->从翻译中学习不足->自信学习->来自人类的5次迭代。 执照 根据知识共享署名4.0国际许可,可以下载Malay-Dataset用于研究。 这项工作是根据。 仅使用此标签标记的数据 受此许
2021-12-12 14:25:28 236.96MB text-mining corpus malaysia bahasa
1