只为小站
首页
域名查询
文件下载
登录
基于Word2Vec的
微博文本
分类研究
以微博为代表的社交平台是信息时代人们必不可少的交流工具.挖掘
微博文本
数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF (Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM分类器对短文本做分类训练并且通过微博数据实验验证了该方法的有效性.
2023-03-16 16:35:47
977KB
Word2Vec
短文本分类
TF-IDF
1
微博文本
的情感分析研究
第一,基于Word2Vec的文本获取及预处理。收集和处理微博语料,分为大规模的旧语料和爬取的小规模疫情语料。对文本进行预处理,比如分词,去停用词等,用Word2Vec训练对文本数据进行向量化。 第二,用大规模语料训练Attention-LSTM情感分类模型与将卷积神经网络应用到文本分析的TextCNN模型的实验进行对比,证明Attention-LSTM在文本情感分析的效果更好。 第三,在微博上爬取的小规模语料上做情感分析,分析疫情下人们的情绪情况。 可以发现,Attention-LSTM模型能较好的分析疫情人们的情感态度
2022-07-06 19:13:59
389.09MB
深度学习
1
COAE2014
微博文本
倾向性分析评测数据集
COAE2014
微博文本
倾向性分析评测数据集
2021-12-16 20:27:03
23.7MB
COAE2014
微博
情感分析
数据
1
DataScienceAssignment:数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理
微博文本
;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图-源码
数据科学大作业 具体内容见pdf 只要把爬虫文件里的cookie换成你的应该就跑的起来 当然还要改日期和关键词
2021-12-06 10:22:13
93.19MB
HTML
1
论文研究-基于贝叶斯分类的大学生关注热点事件
微博文本
分类方法研究 .pdf
基于贝叶斯分类的大学生关注热点事件
微博文本
分类方法研究,张晓宇,殷复莲,本文针对互联网,尤其是微博平台中大学生用户产生的海量的文本分类问题,提出应用贝叶斯网络分类器对微博评论进行分类的解决方案
2021-11-13 03:13:03
325KB
文本分类
1
中文
微博文本
中的开放关系抽取
近年来,微博的Swift发展为实体关系提取(ERE)提供了新的载体。 然而,微博的特征也为ERE研究带来了挑战。 考虑到微博的特点,提出了一种无监督的开放关系抽取(ORE)方法,即MICRO-ORE。 首先,MICRO-ORE使用左右信息熵方法自动从
微博文本
中提取关键短语,并将其链接到外部知识源以规范
微博文本
并添加语义信息。 其次,根据汉语的句法特点,MICROORE制定了提取规则以提取关系元组。 我们用新浪
微博文本
对提出的方法进行了评估,结果表明该方法比传统的关系提取方法能够提取更多的信息,并且满足准确性要求。 据我们所知,MICRO-ORE是第一个中文
微博文本
的ORE方法。
2021-11-08 16:10:47
426KB
microblog;
semantic
extension;
open
1
NLPcc2013-2014
微博文本
情感分类数据集.zip
有Nlpcc2013、Nlpcc2014两年的微博细粒度情感分类资料 两年的文件包含xml原始数据集和 处理后的tsv数据集(带标注(surprise、sadness、like、anger、happiness、disgust,))
2021-08-03 09:30:20
15.81MB
机器学习
自然语言处理
微博语料
1
利用爬虫爬取微博用户微博,对所发
微博文本
进行可视化、文本分析
实现根据给定目标用户的微博UID,得到目标用户微博个人资料,保存到本地 依据目标用户微博UID抓取一定时期内目标用户所发(原创和转发)微博(包含图片、视频),保存到本地 依据所抓取目标用户微博内容、目标用户头像制作目标用户微博关键词词云 依据目标用户微博个人资料,制作目标用户个人电子名片 可视化目标用户日、月、年度微博点赞数、转发数 依据目标用户原创微博所@用户,可视化用户好友关系图 设置评论数阈值,爬取目标用户热门微博下热评 统计目标用户热门微博下热评次数较多用户,挖掘目标用户狂热粉丝
2021-07-08 15:02:41
8.25MB
爬虫
微博文本
可视化、
文本分析
微博文本
情感分析数据-数据集
数据包含四种情感类型的文本文件及中文停词文本
2021-04-26 20:51:10
33.83MB
数据集
1
微博分析和可视化:使用python抓取微博数据到
微博文本
分析和可视化,LDA(树图),关系图,词云,时间趋势(折线图),热度图,词典情感分析(饼图和3D柱状图),词向量神经网络情感分析,tfidf聚类,词向量聚类,关键字提取,文本相似度分析等-源码
微博文本
分析和可视化 0.数据来源和结构 新浪微博,爬虫链接: 微博内容数据结构(mongo数据库导出的json文档) content_example: [ {'_id': '1177737142_H4PSVeZWD', 'keyword': 'A股', 'crawl_time': '2019-06-01 20:31:13', 'weibo_url': 'https://weibo.com/1177737142/H4PSVeZWD', 'user_id': '1177737142', 'created_at': '2018-11-29 03:02:30', 'tool': 'Android'
2021-04-05 21:18:15
66.36MB
visualization
nlp
weibo
pyecharts
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
大唐杯资料+题库(移动通信)
IEEE33节点配电网Simulink模型.rar
transformer_pytorch_inCV.rar
token登录器.rar
Spring相关的外文文献和翻译(毕设论文必备)
故障诊断数据集及实现代码
房价预测的BP神经网络实现_python代码
狂神说全部笔记内容.zip
vivado 破解 lisence(有效期到2037年) 下载
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
avantage 软件 xps 处理软件30天后不能使用问题
人体姿态检测
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
多智能体的编队控制matlab程序(自己编写的,可以运行)
银行笔试 信息科技岗部分真题
最新下载
spark期末复习题总结
数据库课程设计(学生宿舍管理系统)附sql文件、源代码和Word模板
Fastadmin-V1.0.0.20200506_beta-源码
【HarmonyOS】HarmonyOS应用开发者高级认证96分 分享题库
Visual C++ 2010学习版
android studio使用NanoHTTPD 创建 http 服务器打开html并使用webView打开页面
2018年上海交大软件学院优才夏令营机试题目
游戏陪玩语音聊天系统v3.0 独立版本源码
Direct12龙书
二维传热数值计算matlab程序
其他资源
ArcGIS培训课程ppt
Fanuc机器人KAREL语言参考手册
android 火车票订票系统
Fast Hankel Transform.zip
基于JAVAweb的教务排课系统
labview 滤波方法
1618012+1618011班-16180120012(16180120001,16180110110).zip
KEA128中文数据手册
上交软院2017、2018年机试题目及代码
FDTD Solutions 初学者笔记(下)
2020年4月25日,银联官方公布的银行卡BIN资料包
GMIRV1901-带空调、电视、机顶盒码库红外转发芯片.pdf
无领导小组全面解析.pdf
INTEL I350 PCIEx4转4路千兆以太网芯片I350 硬件参考设计+技术手册资料.zip
易人信封打印软件 v4.5.rar
深信服AC初级认证考试题库.pdf
Java坦克大战源代码
北航通信原理真题
基于FPGA的数字频谱分析仪的设计与实现
代价敏感支持向量机(CSSVM)
对抗样本攻击的机器学习
WinHEX 简体中文绿色专业家版(这才是真正专家版)
计算机网络自顶向下方法第六版整本书资源(含付费内容)
全国大学生计算机PPT设计大赛作品part1
StarUML3破解文件
全国12位行政区划代码SQL