【Python爬虫实例学习篇】——5、【超详细记录】从爬取微博评论数据(免登陆)到生成词云 个人博客地址:ht/tps://www.asyu17.cn/ 精彩部分提醒: (1)微博评论页详情链接为一个js脚本 (2)获取js脚本链接需要该条微博的mid参数 (3)获取mid参数需要访问微博主页 (4)访问微博主页需要先进行访客认证 (5)微博主页几乎是由弹窗构成,所有html代码被隐藏在FM.view()函数的参数中,该参数是json格式 工具: Python 3.6 requests 库 json 库 lxml 库 urllib 库 jieba 库(进行分词) WordCloud 库(产生词
2021-12-28 01:38:49 3.65MB 学习 数据 爬虫
1
文本情感分析技术鉴于主题模型在文本挖掘领域的优势,基于主题的文本情感分析技术也成为人们关注的热点,其主要任务是通过挖掘用户评论所蕴含的主题、以及对这些主题的情感偏好,来提高文本情感分析的性能。
2021-12-20 23:30:15 20.79MB 内有代码,部分数据,成果图 NLP
1
【主要内容】微博评论文本分类(完整数据和代码-Traditional_Net_Classification-main) 【适合人群】研发设计 【质量保障】任何问题私信我
2021-12-15 17:05:41 17.31MB 微博评论 文本分类 完整数据 Python
中文、微博、情感分析、SVM模型实现、DNN模型实现。微博评论数据集7962条,其中包含积极和消极情感倾向。主要做法如下: 实现语言:python、tensorflow==1.12、keras==2.2.4 一是基于传统文本特征表示的稀疏性,结合当前成熟技术,设计并实现了基于Word2vec的词向量训练方法,该方法可以将词表示为具有语义关系的特征向量形式,方便模型的使用。 二是采用自然语言处理常用技术完成对文本的预处理操作,既是完成了数据的预处理过程。 三是研究并实现了SVM和DNN两个最具代表性的模型在中文情感分析领的应用,完成了大数据的数据挖掘过程。并在已有的数据集上进行了实验,由具体实验结果我们发现SVM神经网络模型取得了78.03%的F值,较DNN(88%)方法低了9%,但是其训练速度较快。
微博评论数据集7962条,其中包含积极和消极情感倾向
2021-12-14 09:08:26 5.29MB SVM 情感分析
1
微博评论二分类数据集,包括正向情感数据和负向情感数据。12万条数据。1代表正向,0代表负向。一个整理好的文件。
2021-11-25 21:15:07 9.15MB 微博评论二分类数据集
1
微博情感分析语料集,适用于做NLP情感分析
2021-09-28 17:08:43 2.46MB 微博情感分析语料集 情感分析
新浪微博评论批量@软件内置强大的采集功能,可采集评论某条微博的人,采集转发某条微博的人,还可以采集某个用户的粉丝 支持24小时循环不断采集。标配adsl拨号自动换ip,远程打码
1
内含微博评论数据集两个,一个是训练集,一个是测试集。
2021-09-02 17:02:47 506KB 微博
1
使用Python编写的一个根据微博ID自动爬取评论的exe程序(非调用API,那个试了只能爬前50页),用户信息包括生日、地址、性别、粉丝数。压缩包内含使用说明书。懒得自己搞请下载exe,白嫖或者查看代码可以之后看我的另一篇帖子(还没写)
2021-08-29 09:07:53 45.65MB Python 微博 爬虫 exe
1