本科毕业设计用网上的源码 简单的中文文本情感分类 一个用 PyTorch 实现的中文文本情感分类网络,代码较简单,功能较丰富,包含了多种模型 baseline。 环境需求 python == 3.6 torch == 1.1.0 Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz NVIDIA TITAN Xp 其余的见 requirements.txt 使用方法 先预处理,./run_preprocess_word2vec.sh 或 ./run_preprocess_elmo.sh 3(3 是 gpu 编号) 然后运行 python3 main.py --config_path config_cnn.json 预处理 将所给文本的每个词转换成预训练模型的词向量后存到文件里。我分别尝试了这两种 embedding: ELMo 中文预训练模型,1024d( Chinese-Word-Vectors,300d( 请自行下载相应的模型文件到 data/word2vec/ 或 data/zhs.model 文件夹下。 具体细节见 preprocess.py 文件
2022-03-05 11:13:27 4.17MB 系统开源
1
LSTM文本分类情感分析 使用LSTM进行文本分类/情感分析。使用LSTM对数据执行文本分类/情感分析。这些推文已从Twitter撤出,然后进行了手动标记。列: 地点 鸣叫于 原始推文 标签
2022-03-04 22:50:53 4.77MB Python
1
Twitter情绪分析 该项目是关于使用Apache Spark结构化流,Apache Kafka,Python和AFINN模块对所需Twitter主题进行情感分析的。 您可以了解所需主题的情感状态。 例如; 您可能对《权力的游戏》的新剧集感到好奇,并且您可能先前已经获得了某人对该新剧集的意见。 根据意见,答案可以是负的,中性的或正的。 代码说明 身份验证操作已通过Python的Tweepy模块完成。 您必须从Twitter API获取密钥。 名为TweetListener的StreamListener是为Twitter Streaming创建的。 StreamListener为名为“ t
2022-03-03 20:17:40 3KB python twitter kafka spark
1
CSV格式的IMDB数据集(情感分析) IMDB电影评论数据集转换为CSV文件 Test.csv Train.csv Valid.csv
2022-03-02 16:41:58 25.3MB 数据集
1
广告广告 字节跳动广告系统下的穿山甲平台大量招人,有兴趣的直接发简历到我邮箱:。 也可以直接加我 QQ:2263509062 基于LSTM的中文情绪识别 基于keras深度学习库,搭建LSTM网络,来对数据集进行情绪识别,分成六类情绪。 数据集 下载地址: 数据概览: 4万多条句子,分为其他(Null), 喜好(Like),悲伤(Sad),厌恶(Disgust),愤怒(Anger),高兴(Happiness)六类 数据来源:数据分别来源于NLPCC Emotion Classification Challenge(训练数据中17113条,测试数据中2242条)和微博数据筛选后人工标注(训练数据中23000条,测试数据中2500条)。 数据提供方: 清华大学计算机系黄民烈副教授 项目结构 |——data | |——train.json 原数据集 | |——stopWords.tx
2022-03-01 18:36:11 35.01MB Python
1
sentiment-analysis-platform 基于LSTM的电商评论情感分析平台 技术要点: Java前端:Bootstrap4、jQuery Java后台:SpringBoot Python服务: Python3、Flask 数据库:MySQL、MongoDB 模型框架:Keras+TensorFlow 爬虫:selenium
2022-03-01 16:25:28 40.83MB JavaScript
1
CLUEDatasetSearch 中英文NLP数据集。可以点击。 您可以通过贡献你的力量。上传五个或以上数据集信息并审核通过后,该同学可以作为项目贡献者,并显示出来。 如果数据集有问题,欢迎提出问题。 所有数据集均压缩网络,只做整理供大家提取方便,如果有缺陷等问题,请及时联系我们删除。 内尔 ID 标题 更新日期 数据集提供者 许可 说明 关键字 类别 论文地址 备注 1个 2017年5月 北京极目云健康科技有限公司 数据统计其云医院平台的真实电子病历数据,共计800条(个别病人单次就诊记录),经脱敏处理 电子病历 命名实体识别 \ 中文 2 2018年 医渡云(北京)技术有限公司 CCKS2018的电子病历命名实体识别的评估任务提供了600份标注好的电子病历文本,共需识别含解剖部位,独立症状,症状描述,手术和药物五类实体 电子病历 命名实体识别 \ 中文 3 \ MSRA 数据抽样MSRA,标注形式为BIO,共有46365条语料 姆斯拉 命名实体识别 \ 中文 4 1998年1月 人民日报 数据来源为98年人民日报,标注形式为BIO,共有23061条语料 98人民日报 命名实体识
2022-02-24 08:45:26 695KB nlp qa sentiment-analysis text-classification
1
骇客深度学习:使用TensorFlow 2和Keras和Python的机器学习教程(包括Jupyter笔记本)-(LSTM,超电流表调整,数据预处理,偏差方差折衷,异常检测,自动编码器,时间序列预测,对象检测,情感分析,使用BERT进行意图识别)
1
亚马逊上的Analytics(分析)评论 数据分析考试最终项目,。 由 , , 。 探索,情感分析,主题分析(LDA)和VueJS Web应用程序,公开受过训练的模型。 (网络演示部署) 勘探 网络演示 跑 设置一个Python虚拟环境并安装所需的软件包 cd scripts python3 -m venv . source bin/activate pip3 install -r requirements.txt python3 -m spacy download en (可选)安装ipynb内核以使用venv软件包 pip3 install --user ipykernel
1
使用ConvNet的Twitter情绪分析 一个工具 预测推文的情绪“积极性” 如何使用它? >> from sentiment import sentiment_score >> print sentiment_score(u"I love you") 0.9999 它返回的情绪索引范围为0(负情绪)到1(正情绪)。 在线演示 预测单个推文的情绪“积极性” 概述的“积极性” 点击 算法 有关该算法的更多信息,请参阅。 技术选择 作为Web框架 作为神经网络训练的实现 作为神经网络分类(在线版本)的实现 训练技巧 扇入,扇出初始化 退出 阿达达 贡献者 韩晓和姚璐
1