文本分类语料库(复旦)训练语料,本语料库由复旦大学李荣陆提供,共9804篇文档,两个预料各分为20个相同类别。
2024-06-27 11:46:10 52.26MB 文本分类
1
文字分类 文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的合并分类等等。此处分为两个部分: 第1部分:基于scikit学习机器学习的Python库,对比几个传统机器学习方法的文本分类 第2部分:基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN 本文语料:,密码:P9M4。更多新闻标注语料,。 预训练词向量模型来自,下载地址: 。 第1部分:基于scikit-learn机器学习的文本分类方法 基于scikit-
2024-06-24 14:49:13 208KB python nlp machine-learning deep-learning
1
人工智能-项目实践-问答系统-Emotional First Aid Dataset, 心理咨询问答、聊天机器人语料库 心理咨询问答语料库(以下也称为“数据集”,“语料库”)是为应用人工智能技术于心理咨询领域制作的语料。据我们所知,这是心理咨询领域首个开放的 QA 语料库,包括 20,000 条心理咨询数据,也是迄今公开的最大的中文心理咨询对话语料(发稿日期 2022-04-07)。数据集内容丰富,不但具备多轮对话内容,也有分类等信息,制作过程耗费大量时间和精力,比如标注过程是面向多轮对话,平均每条标记耗时超过 1 分钟。
CASIA语音情感语料库,共包括四个专业发音人,六种情绪生气(angry)、高兴(happy)、害怕(fear)、悲伤。4个人(2男2女),50个句子,6种情绪,即不同人对相同的文本赋以不同的情感来阅读,这些语料可以用来对比分析不同情感状态下的声学及韵律表现。
2024-05-18 18:16:50 56.08MB 人工智能 语音识别 情绪识别
1
国际语料库与二语习得前沿演进的可视化研究--基于Web of Science数据库,王静,韩忠军,语料库语言学的研究已经历经了50多年的发展历史。本文以2005-2015年间WoS数据库中有关语料库与二语习得的文献为研究对象,运用科学计�
2024-01-12 20:41:19 858KB 首发论文
1
资源MIT发布的10大自然语言处理数据集和语料库
2024-01-03 18:39:48 2KB
1
青云语料库 12万对话语料青云库
2024-01-03 16:51:46 6.78MB nlp
1
用于语料库研究的必备软件,可分段分章分词分析语料,主要用于翻译研究方面
2023-09-24 22:32:29 16.06MB 词汇检索 语料库
1
这是关于微博情感分析的语料,类别分好,可以直接投入分析程序中使用,方便大家研究情感分类,免去大家写爬虫或API等方式爬取数据的烦恼
2023-09-19 19:27:06 27.15MB 情感分析 微博 语料库
1
语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。
2023-05-28 12:53:55 12.97MB 灵玖LJCorpus中文语料库分析软件
1