国际语料库与二语习得前沿演进的可视化研究--基于Web of Science数据库,王静,韩忠军,语料库语言学的研究已经历经了50多年的发展历史。本文以2005-2015年间WoS数据库中有关语料库与二语习得的文献为研究对象,运用科学计�
2024-01-12 20:41:19 858KB 首发论文
1
资源MIT发布的10大自然语言处理数据集和语料库
2024-01-03 18:39:48 2KB
1
青云语料库 12万对话语料青云库
2024-01-03 16:51:46 6.78MB nlp
1
用于语料库研究的必备软件,可分段分章分词分析语料,主要用于翻译研究方面
2023-09-24 22:32:29 16.06MB 词汇检索 语料库
1
这是关于微博情感分析的语料,类别分好,可以直接投入分析程序中使用,方便大家研究情感分类,免去大家写爬虫或API等方式爬取数据的烦恼
2023-09-19 19:27:06 27.15MB 情感分析 微博 语料库
1
语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。
2023-05-28 12:53:55 12.97MB 灵玖LJCorpus中文语料库分析软件
1
这是Trigram语言模型的实现。 用法: (先决条件:您需要在计算机上安装python版本3才能运行此程序) 将corpus.zip解压缩(使用“在此处提取”)到项目结构的根目录。 使用python3执行main.py。 (例如:python /main.py) 请按照控制台上的说明进行操作。
2023-05-10 18:48:12 7.06MB Python
1
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
2023-04-13 20:23:17 365.48MB 自然语言理解 NLP 机器翻译
1
通过从网页中提取文本来构建用于藏文自然语言处理的大规模文本语料库
2023-04-05 22:54:11 1.5MB 研究论文
1
Gensim数据有什么用? 研究数据集经常消失,随时间变化,变得过时或没有理智的实现来处理数据格式的读取和处理。 因此,Gensim推出了自己的d Gensim数据的用途是什么? 研究数据集经常消失,随时间变化,变得过时或没有理智的实现来处理数据格式的读取和处理。 因此,Gensim推出了自己的数据集存储,致力于提供长期支持,合理的标准化用法API,并专注于非结构化文本处理(无图像或音频)的数据集。 该Gensim数据存储库用作该存储。 您无需直接使用此存储库。 因斯泰
2023-04-04 23:05:25 22KB Python Deep Learning
1