The Range program is used for analysing the vocabulary load of texts. It can tell you how much and what vocabulary occurs in a particular text or group of texts. It used to be called VORDS, FVORDS, and VocabProfile. It is available here to download with either the GSL/AWL lists (General Service List / Academic Word List) or with the British National Corpus lists, plus instructions for using the program. 包括basewrd词表文件和range32.exe,range32h.exe(BNC_COCA_25000.zip、Range_GSL_AWL.zip、BNC-14000-and-programs-and-instructions.zip、Information-on-the-BNC_COCA-word-family-lists-20180705.pdf、range-level-three-partial.zip)
2021-04-06 14:13:48 2.32MB 自然语言处理 NLP 语料库 词表
1
基于BiGRU和贝叶斯分类器的文本分类,利用搜狐新闻数据集进行实现,对12个种类进行分类,里面设计BiGRUB提取文本特征,TF-IDF特征权重赋值,Bytes分类进行实现,学习深度学习和机器学习很好的借鉴。
2021-04-06 10:57:38 103KB 技术 python 自然语言处理
1
从2013~2019年的49份行业知识图谱报告
1
1. 给出前100个汉字高频字的频率统计结果; 2. 分别给出前1、20、100、600、2000、3000汉字的字频总和; 3. 计算汉字的熵值;
2021-04-05 13:06:37 337KB python 自然语言处理
1
python程序设计
2021-04-04 09:05:45 27.43MB python程序设计
1
中文分句也是自然语言处理的基础之一,一般来说,中文中每个句子都表达了一个完整的意思。GATE的ANNIE提供了一个ANNIE Sentence Split资源,可以用于划分英文句子,但对中文的划分效果很不好(整篇文章分成了一个句子)。 GATE提供了两种句子划分的方法:基于JAPE规则和基于正则表达式,分别对应于类gate.creole.splitter. SentenceSplitter和gate.creole.splitter.RegexSentenceSplitter。本文先来讲述如何基于JAPE规则进行中文句子划分
2021-04-03 21:27:42 163KB gate
1
自然语言处理,关键词提取,机器学习,人工智能,深度学习
2021-04-03 09:25:40 10KB 自然语言处理
1
中文医学问答数据集 数据集描述:中文医药方面的问答数据集,超过10万条。 数据说明:questions.csv:所有的问题及其内容。answers.csv :所有问题的答案。 train_candidates.txt, dev_candidates.txt, test_candidates.txt :将上述两个文件进行了拆分。
1
文件中包含百度网盘链接和密码
1
百度网盘链接和密码在文件中
1