微博情感分析语料集,适用于做NLP情感分析
2021-09-28 17:08:43 2.46MB 微博情感分析语料集 情感分析
英文情感分析语料库,包含积极消极两个方面的评价,用于神经网络模型深度学习方面,为需要训练集的同学们提供优质的英文评论数据集,仅供科研学习之用,欢迎下载使用!
2021-09-19 20:55:28 409KB 情感分析 英文评论
1
kaggle 电影评论文本情感分析(Bag of Words Meets Bags of Popcorn)数据集,和官方的一致。
2021-09-16 21:01:53 51.58MB kaggle 电影评论 情感分析 数据集
1
smote的matlab代码 JD Comment_emotional analysis 京东评论文本挖掘(产品口碑分析) 一、文本挖掘方向及基本思路 文本挖掘方向: 用于分析京东用户对手机的观点、态度、情绪、立场以及其他主观感情的技术。 文本挖掘基本思路: 1、探索性分析:观测数据信息(含数据字段、数据缺失情况、样本分布情况等) 2、数据预处理:包括去除无效标签、编码转换、文档切分、基本纠错、去除空白、大小写统一、去标点符号、去停用词、保留特殊字符等。 3、文本分词及特征提取:jieba中文文本分词模型、文本特征转化未向量空间模型、海量稀疏特征做特征提取。 4、分类建模和效果评估:选择特定分类模型,建立模型并作效果评估和结论分析。 二、探索性分析 1、查看原始数据前4条数据情况 2、查看数据集记录数、维度、数据类型情况 数据集大小21*3637,时间字段为数值型需转化为日期型 3、文本评分分布情况 4、评论发布时间分布情况 5、评论长度与评分关系情况 三、文本预处理 1、中文分词:著名的nltk包对分词有良好的效果,劣势在于对中文不友好。对此选用jieba包进行处理。这里我们把文本通
2021-09-15 21:43:14 592KB 系统开源
1
用于朴素贝叶斯的案例数据集,包括停用词和训练集
2021-08-23 13:11:22 7KB 朴素贝叶斯 训练集
1
【项目实战】Python实现贝叶斯算法疫情微博评论情感分析 资料说明:包括数据集+源代码+Word文档说明。 资料内容包括: 1)需求分析; 2)数据采集; 3)数预处理; 4)数据分析过程; 5)利用贝叶斯定理进行情感分析; 6)情感倾向柱状图。
2021-08-20 01:28:35 12.97MB
随着电子商务、社交媒体等信息技术的快速发展,在线评论已经成为影响消费者购买决策和产品市场销量的重要信息资源。从制造企业的视角来看,在线产品评论作为一种新的口碑形式,包含了消费者对产品的全方面评价,有助于制造企业了解消费者的需求。相比较传统的调查问卷和访谈数据,在线产品评论具有数据量大,收集成本低等优势。此外,由于来自消费者的主动分享,而非被动问答,在线评论数据能够更真实地反映消费者的需求。在线评论数据形式主要包括文本、音频、图形等。尽管数据量大,更新速度快,数据种类繁多,但它的主要作用还是体现在其真实性和价值性上。为保证数据的真实性,数据质量的评估是一个重要问题。另外,随着在线评论数据规模的不断扩大,价值稀疏问题也变得越来越重要。通过消除不重要和不相关的数据,提供有用的和有价值的数据,可以帮助企业更好地了解消费者和把握消费市场。
2021-07-21 18:05:28 80B 文本分析 python
1
京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、
2021-07-08 15:02:46 592KB 情感分析 京东评论
# emotionAnalysis 疫情背景下,基于情感词典和机器学习对新闻和微博评论的情感分析 # Data Science Basics in SWI, NJU, 2020-Fall > ## 计算社会学:基于NLP技术的新冠疫情下的社会心态研究 Cong Jin , YDJSIR, Sugar Xu‘s project of 2020 Data Science Basic Course in SWI, NJU. 此为发布开源的版本而不是开发环境中使用的版本。 ## 文件结构 ```bash │ LICENSE │ README.md ├─Analyze # 分析数据的过程中所使用的所有代码 ├─Data # 原始数据以及处理过后的所有数据 ├─Report # 报告相关源文件以及最终报告的成品 └─Spyder # 爬虫代码 ``` 文件结构经过事后整理,并不是工作时目录的状态,因而代码中所涉及的路径需要稍加修改后运行。 原始报告数据在评分后抹掉相关关键词后后放出。 > ### `Data`目录下文件结构 > > 该目录下共有6个文件夹,分别对应`stage0` - `stage6` > > ##### stage内文件目录结构 > > ```bash > │ COVkeywords-Stage-.json # 人工筛选后的疫情相关关键词 > │ COVkeywords-Stage.json # 未经筛选的疫情关键词 > │ keywords-Stage.json # 从荔枝新闻中获取的原始结果 > │ ratioByDate.png # 该阶段内每日疫情相关重点微博占比 > │ SaveTest.png # 疫情相关度分布拟合结果图1 > │ SaveTest_Fit.png # 疫情相关度分布拟合结果图2 > │ stageCOVWeibo.json # 该阶段内疫情相关重点微博(按时间先后排序) > │ stageCOVWeiboByImportance.json # 该阶段内疫情相关重点微博(按疫情相关度排序) > | SaveTest-热度.png # 各项热度指标占比 > │ stageInfo.json # 该阶段基础信息 > │ weiboPolar.png # 疫情相关重点微博情感极性图 > | weiboEmotion.png # 当前阶段的疫情相关微博情感倾向 > ├─YYYY-MM-DD- > ├─YYYY-MM-DD- > ├─YYYY-MM-DD- > ├─YYYY-MM-DD- > ... > └─YYYY-MM-DD- > ``` > > ##### 每个日期内文件目录结构 > > ```bash > YYYY-MM-DD > | jstvRAW.csv # 疫情相关关键词检索得到的荔枝新闻原始数据 > | keywords.json # 荔枝新闻正文提取出来的关键词及其乘以100以后的TextRank权值 > | wordcloud.html # 由荔枝新闻生成的词云图 > | blog-Scored.json # 每篇微博都有一个疫情相关度 > | blog-COV.json # 筛选后的新冠疫情相关微博 > | blogInfo.json # 当日博客相关基础信息 > | weiboEmotion.png # 基于心态词典的当日疫情相关微博重点评论情感分析生成的雷达图 > └─weiboEmotion.csv # 基于心态词典的当日疫情相关微博重点评论情感分析原始数据 > ``` ======= # emotionAnalysis 疫情背景下,基于情感词典和机器学习对新闻和微博评论的情感分析
2021-06-22 19:18:58 2.09MB 疫情 微博评论 情感分析 情感
中文情感分析是自然语言处理的一个经典实验,这个实验通过一般通过各种训练好的数据集,对其中的数据进行预处理后采用各种网络模型进行学习和训练最终得到一个良好的loss和acuary之后,把模型保存下来,并输入一句话运行输出这句话的情感是正面还是负面的,最终输出的训练效果和使用的模型、数据集以及训练次数都有关系。
2021-06-12 11:11:09 107.75MB tensorflow2.0 深度学习 电影评论情感分析
1