本项目基于 weibo_senti_100k.csv 数据集,分别使用朴素贝叶斯、逻辑回归、LSTM、CNN、BERT等模型进行了实验,其中涉及的词向量表示方式包括one-hot、Bag of Words、TF-IDF、Word2Vec、Glove等。对于Word2Vec和Glove词向量的构建过程,本项目也提供了相关代码。项目中模型的训练运行脚本为train.sh,如bert_train.sh,模型的测试运行脚本为test.sh,如bert_test.sh。此外,本项目也会给出如何将训练好的BERT模型以服务的形式进行部署,以满足商业应用中的实时性需求。针对具体模型的使用,请读者查看*_README.md文件。希望通过本项目的学习,读者能够对情感分析中常用的模型技术有进一步的理解。
1
1、简单易上手; 2、结果清晰
2022-03-31 09:47:06 1.85MB 自然语言处理 人工智能 nlp
1
0.快速开始 挑战杯项目:金融文本情感分析模型|| 挑战杯项目:财务文本情感分析模型 金融领域短文本情感分析 配置要求: python 3.x 1.使用方法 1.0下载 sudo git clone https://github.com/AsuraDong/news-emotion.git news_emotion mv -R ./news_emotion/ 你的程序路径/ 1.1文件结构 clean_data / # 清洗数据 __init__ . py clean_html . py # 清洗网页标签 langconv . py # 简体和繁体转化 zh_w
2021-11-11 15:02:35 3.6MB python nlp finance machine-learning
1
这篇论文介绍了表情符号对于情感分析的贡献
2021-10-30 10:57:01 372KB 表情符号 情感分析
1
smote的matlab代码 JD Comment_emotional analysis 京东评论文本挖掘(产品口碑分析) 一、文本挖掘方向及基本思路 文本挖掘方向: 用于分析京东用户对手机的观点、态度、情绪、立场以及其他主观感情的技术。 文本挖掘基本思路: 1、探索性分析:观测数据信息(含数据字段、数据缺失情况、样本分布情况等) 2、数据预处理:包括去除无效标签、编码转换、文档切分、基本纠错、去除空白、大小写统一、去标点符号、去停用词、保留特殊字符等。 3、文本分词及特征提取:jieba中文文本分词模型、文本特征转化未向量空间模型、海量稀疏特征做特征提取。 4、分类建模和效果评估:选择特定分类模型,建立模型并作效果评估和结论分析。 二、探索性分析 1、查看原始数据前4条数据情况 2、查看数据集记录数、维度、数据类型情况 数据集大小21*3637,时间字段为数值型需转化为日期型 3、文本评分分布情况 4、评论发布时间分布情况 5、评论长度与评分关系情况 三、文本预处理 1、中文分词:著名的nltk包对分词有良好的效果,劣势在于对中文不友好。对此选用jieba包进行处理。这里我们把文本通
2021-09-15 21:43:14 592KB 系统开源
1
京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、
2021-07-08 15:02:46 592KB 情感分析 京东评论
Scrapy 爬虫 + 数据清理 + 数据分析 + 构建情感分析模型 一、爬取豆瓣Top250的短评数据 movie_item movie_comment movie_people 二、数据清理与特征工程+统计分析 movie_item 总评分最高的前10部电影 最受欢迎的电影类别排名 最受欢迎的电影出品国家排名 最受欢迎的电影导演排名 最受欢迎的电影演员排名 最受欢迎的电影语言排名 根据电影时长的电影排名 根据电影投票数的电影排名 根据电影评价数的电影排名 根据电影提问数的电影排名 根据电影发布时间的规律 1~5星级投票的百分比 电影简介的情感分析 movie_comment 就肖申克的救赎这个电影而言 短评词云 用朴素贝叶斯完成中文文本分类器 用svc完成中文文本分类器 用facebook-fasttext有监督完成中文文本分类 用facebook-fasttext无监督学习 用cnn做中文文本分类 用rnn做中文文本分类 用gru来完成中文文本分类 全部影片的短评数据分析 movie_people 短评人常居地按照国家分布 中国短评人常居地按照省份分布 每个短评人的被关注数与好友数 中国短评人的被关注数和好友数的人均地域分布 根据点评人个人简介构建中文文本分类模型 三、movie_item + movie_comment + movie_people 三个数据集间的协同分析 通过短评来预测被评价电影是什么类型 小结
2021-07-08 15:02:44 73.43MB TOP250 豆瓣电影短评 Scrapy
TOP250豆瓣电影短评:Scrapy 爬虫 数据清理/分析 构建中文文本情感分析模型
2021-04-21 07:08:22 73.43MB Python开发-Web爬虫
1
本资源为基于知网情感词典设计的情感分析程序,程序中包含设计的代码文件,情感词典文件,程度词表文件,以及微博语料和情感分析结果文件。
2021-02-20 14:22:42 243KB 代码
1
该资料适合学生党学习参考,主要使用知网的情感词典进行情感分析,分析准确率尚可。
2021-01-28 22:31:38 242KB 情感分析模型 模型 python 情感分析
1