#PennToPCFG 从 Penn Treebank 风格的语料库(例如华尔街日报)中学习未词法化的 PCFG。 需要 NLTK2 来读取树库和处理树。 ##用法 usage: PennToPCFG.py [-h] [-p PENN] [-g GRAMMAR] [-pe PENNEVAL] [-s SENTENCES] [-t TREES] [-l LENGTH] [-b DEBINARIZE DEBINARIZE] Learns an unlexicalised PCFG from a Penn Treebank file optional arguments: -h, --help show this help message and exit -p PENN, --penn PENN The Penn
2022-10-01 18:45:22 4KB Python
1
Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 该数据集由斯坦福大学的 NLP 组发布,其中句子和短语共计 239232 条,相较于忽略单词顺序的大多数情绪预测系统,这套深度学习模型建立了基于句子 结构 的完整表示。它可根据单词组成的短语判断情绪。 该数据集由斯坦福大学 自然语言处理 组于 2013 年发布,相关论文有《Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank》。
2022-07-13 16:05:11 11.36MB 数据集
Chinese Treebank 8.0 LDC中文句树库(LDC2013T21),已标注句子的各个词语词性、句中成分、语义信息,可用于自然语言处理的句法分析或词性标注等任务。
2022-05-25 13:43:46 23.39MB nlp 自然语言处理 语料库 句树
1
ctb8.0(Chinese Treebank 8.0)数据集 介绍:Chinese Treebank 8.0 包含大约 150 万字广播的注释和解析文本,来自中文新闻专线、政府文件、杂志文章、各种广播新闻 对话节目、网络新闻组和博客。 中国树库项目于 1998 年在宾夕法尼亚大学开始,在科罗拉多大学继续,然后转移到布兰代斯大学。该项目的目标是提供一个大型的、词性标记的和完全括号括起来的中文语料库。第一个交付,中国树库 1.0,包含来自新华社新闻专线的 100,000 个句法注释词。它后来被更正并于 2001 年作为中国树库 2.0 (LDC2001T11)发布,由大约 100,000 字组成。2004年, LDC发布了中文树库4.0(LDC2004T05),更新版本约40万字。一年后,LDC发布了50万字的中文树库5.0(LDC2005T01)。2007年发布的中文树库6.0(LDC2007T36),包含78万字。Chinese Treebank 7.0 (LDC2010T08)于 2010 年发布,增加了新的带注释的新闻专线数据、广播材料和网络文本,总字数约为 100 万字。
2022-05-10 20:06:17 3.98MB 学习 文档资料
by Tomas Mikolov, 2010-2012 http://www.fit.vutbr.cz/~imikolov/rnnlm/
2021-10-15 22:03:45 30.77MB PennTreebank PTB TomasMikolov
1
Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 Stanford Sentiment Treebank 标准情感数据集_datasets.txt Stanford Sentiment Treebank_datasets.zip
2021-09-04 14:50:42 11.36MB 数据集
1
corenlp中的词性标注缩写含义使用的是Penn Treebank tag set,这是全部对应缩写的含义,这份资源下载自https://www.eecis.udel.edu/~vijay/cis889/ie/pos-set.pdf
2021-08-14 00:42:21 55KB nlp pos tag 词性标注标签含义
1
PTB(Penn Treebank Dataset)文本数据集,压缩包
2021-04-11 09:07:11 31.20MB 数据集 深度学习
1
情绪分析 在 上通过微调 , 或训练的情感分析神经网络。 安装要求 pip install numpy pandas torch transformers 使用我在s3上载的模型分析您的输入 python analyze.py 火车模型 python train.py --model_name_or_path bert-base-uncased --output_dir my_model --num_eps 2 支持bert-base-uncase,albert-base-v2,distilbert-base-uncase和其他类似模型。 评估您训练的模型 python evaluate.py
2021-04-03 15:58:11 16.94MB nlp flask machine-learning vuejs
1
Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点均有细粒度的情感注解。 该数据集由斯坦福大学的 NLP 组发布,其中句子和短语共计 239232 条,相较于忽略单词顺序的大多数情绪预测系统,这套深度学习模型建立了基于句子结构 的完整表示。它可根据单词组成的短语判断情绪。 该数据集由斯坦福大学自然语言处理 组于 2013 年发布,相关论文有《Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank》。
1