里面包含nlp情感分析训练测试时所使用的数据集(正例,负例),以及词向量文件。
2021-09-15 15:21:28 101.3MB nlp
1
Transformers_for_Text_Classification 基于Transformers的文本分类 基于最新的出品的v2.2.2代码进行重构。为了保证代码日后可以直接复现而不出现兼容性问题,这里将放到本地进行调用。 强调 支持transformer模型后接各种特征提取器 支持测试集预测代码 精简原始变形金刚代码,使之更适合文本分类任务 优化日志记录终端输出,使之输出内容更加合理 支持 型号: 伯特 伯特·cnn bert_lstm 伯特·格鲁 互联网 xlnet_cnn xlnet_lstm xlnet_gru 阿尔伯特 内容 数据集:存放数据集 pretrai
1
有代码,有数据,有教程文档。三部分全部完整,这个分非常值了,上手即用,立马处理你手上的文本,进行敏感清理,搭建属于你自己的个人网站吧
2021-09-15 09:59:17 118KB NLP 敏感词汇 网站搭建
1
Flask-NLP-情感分析 简单的基于Textblob和NLP的命令情感分析器Web应用程序。 使用的模块 模块 用例 烧瓶 Web应用程序 flask_bootstrap 提供CSS 文本框 处理单词 时间 记录执行时间 随机的 随机生成东西 正在运行的项目 在Windows上安装 在Windows中设置Flask应用程序 set FLASK_APP=app.py set FLASK_DEBUG=1 在Unix上安装 在Unix中设置flask应用程序 export FLASK_APP=app.py export FLASK_DEBUG=1 运行应用程序 设置flask应用程序后,要运行应用程序,请使用以下命令 flask run --port=8080 --port标志是可选的 谢谢你! DHRUV PRAJAPATI
2021-09-14 14:44:45 4KB HTML
1
关系提取中的位置感知注意力RNN模型 此存储库包含PyTorch代码,用于纸上的。 TACRED数据集:有关TAC关系提取数据集的详细信息可以在上找到。 要求 Python 3(在3.6.2上测试) PyTorch(在1.0.0上测试) 解压缩,wget(仅用于下载) 制备 首先,从斯坦福大学网站下载和解压缩GloVe载体,方法如下: chmod +x download.sh; ./download.sh 然后使用以下方法准备词汇和初始单词向量: python prepare_vocab.py dataset/tacred dataset/vocab --glove_dir data
1
WikiAnswers 是一个英语自然语言问题数据集,从WikiAnswers 网站上抓取的相同问题的不同表述形式,包括 250 万个不同问题和 1800 万个问题复述对。 问题:         What are the green blobs in plant cells?问题复述:         a green substance in the plant cell be the ?         be cytoplasm a green cell part in certain plant cell ?         package of green coloring in plant cell ?         part of the plant cell where the cell get it green color ?         the green part in a plant be call ?         the green part of a plant cell ?         the part of the plant cell that make the plant green be call ?         what be green part call ?         what be green part in plant cell ?         what be the green body in a plant cell ?         what be the green machine within a plant cell ?         what be the green part of a plant cell ?         what be the green part of plant cell ?         what be the green substance in plant cell ?         what be the name of the green thing in the plant cell ?         what be the part of plant cell that give it green color ?         what be the part of the cell that produce the green color of the plant ?         what be the part of the plant cell that make the green color ?         what be to part of the plant cell ?         what cell part do plant have that enable the plant to be give a green color ?         what in a plant cell that be green ?         what part of the cell be large and green ?         what part of the plant cell turn it green ?
1
问题描述 在语义连贯的句子中去掉一个词语,形成空格,要求在给出的对应备选答案中,系统 自动选出一个最佳的答案,使语句恢复完整。 相关语料 1、 train_data文件夹: 1.常老师提供的522个txt格式的文件 2.从 一共有811个训练文本 2、 test_data文件夹: 1、 Development_set: 一份含有 240 句话的语料及答案 2、 test_set: 一份含有 800 句话的测试语料,每句话有一个空格和 5 个备选答案 3、 middle_data文件夹: 存放数据预处理后的文本文件,方便进行后续训练 4、 model文件夹: 存放模型 5、data_preprocess.py 进行数据预处理 6、train_model.py 模型训练 7、test_data_score.py 输出测试集的准确率和输出结果文件 评测方法 准确率=正确填空句子的个数/全部句子的
2021-09-14 09:40:43 87KB Python
1
这篇博客中的资源《自然语言学习——使用word2vec对文本进行情感分析》,其中包含代码,训练集,测试集、停止词。
2021-09-13 11:56:48 19.75MB nlp word2vec
1
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度 考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法 ( FS) ,并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不 影响分类准确率的情况下,分类的速度明显提高。 关键词: 计算机应用; 中文信息处理; 关键词提取; Web文档分类
2021-09-13 10:51:26 192KB 文本分类 关键词提取 nlp
1
通过双向LSTM-CNNs-CRF教程进行端到端序列标签 这是针对ACL'16论文的PyTorch教程 该存储库包括 资料夹 设置说明文件 预训练模型目录(笔记本电脑将根据需要自动将预训练模型下载到此目录中) 作者 安装 最好的安装pytorch的方法是通过 设置 创建新的Conda环境 conda create -n pytorch python=3.5 激活公寓环境 source activate pytorch 使用特定的python版本(python 3.5)设置笔记本 conda install notebook ipykernel ipython kernel install --user PyTorch安装命令: conda install pytorch torchvision -c pytorch NumPy安装 conda install -c anaco
2021-09-13 10:31:31 34.06MB nlp tutorial deep-learning reproducible-research
1