只为小站
首页
域名查询
文件下载
登录
Python应用实战代码-Python爬取
豆瓣影评
-分析挖掘用户与电影之间的隐藏信息
Python应用实战代码-Python爬取
豆瓣影评
-分析挖掘用户与电影之间的隐藏信息
2021-07-21 12:04:18
791KB
爬虫
Python
用户画像
豆瓣20万条影评数据集.txt
本宝宝采集的豆瓣20万条影评原始数据集,希望大家积极下载,尊重宝宝的劳动成果,后期有时间我还为大家提供数据集哈。 机器学习,nlp,深度学习的宝宝赶快看过来,看过来哈。 数据集格式: title##star##comment 电影名称##评论星级(1-5星)##评论内容
2021-07-15 21:45:58
19.93MB
nlp
情感分析
豆瓣影评
影评数据
1
爬取
豆瓣影评
、清洗、jieba分词、做词云图
爬取
豆瓣影评
、清洗、jieba分词、做词云图 本程序主要分为3个过程。 1、抓取网页数据 使用Python爬虫技术获取豆瓣电影中最新上映电影的网页,其网址如下: https://movie.douban.com/cinema/nowplaying/qingdao/ 正在上映的电影 每个电影的ID和名称 通过其HTML解析出每部电影的ID号和电影名,获取某ID号就可以得到该部电影的影评网址,形势如下: https://movie.douban.com/subject/26900949/comments https://movie.douban.com/subject/26871938/comments 其中,26900949、26871938就是电影《天使陷落》、《灭绝》的ID号,这样仅仅获取了20哥影评,可以指定开始号start来获取更多影评,例如: https://movie.douban.com/subject/26900949/comments?start=40&limit=20 这意味着获取从第40条开始得20个影评。 2、清理数据 通常将某部影评信息存入eachCommentList列表中。为便于数据清理和词频统计,把eachCommentList列表形成字符串comments,将comments字符串中的“也”“太”“ 的”等虚词(停用词)清理掉后进行词频统计。 3、用词云进行展示 最后使用词云包对影评信息进行词云展示。
2021-06-23 19:07:33
9.91MB
jieba
清洗
词云图
豆瓣影评
2万多条豆瓣电影评论数据
豆瓣影评
数据,21000多条,包括movie_name, user_name, score, comment, date等字段,只需简单处理就可使用。
2021-03-08 13:06:37
5.59MB
nlp
情感分析
豆瓣影评
1
豆瓣影评
数据集
豆瓣5万条影评原始数据集,机器学习,nlp,深度学习的宝宝赶快看过来,看过来哈。 数据集格式: title,star,comment,label是对应电影名称,评论星级(1-5星),评论内容,差评好评(星级大于3为好评)
2019-12-21 22:02:04
9.76MB
NLP
1
Python项目案例开发从入门到实战源代码第20章 词云实战——爬取
豆瓣影评
生成词云
Python项目案例开发从入门到实战源代码第20章 词云实战——爬取
豆瓣影评
生成词云
2019-12-21 21:26:25
607KB
python
1
豆瓣电影数据集12万+用户影评40万+爬虫程序.zip
使用python语言实现的豆瓣电影数据搜索下载程序,包含数据文件和源代码
2019-12-21 21:12:17
42.47MB
python
豆瓣影评
1
抓取
豆瓣影评
并制作词云
爬取豆瓣电视剧天盛长歌影评,并去掉其中的停止词,生成词云,
2019-12-21 19:30:37
6KB
python爬虫
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
雷达信号处理仿真程序(MTI,MTD等)
token登录器.rar
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
华为OD机试真题.pdf
MVDR,Capon波束形成DO估计.zip
MATLAB车牌识别系统
Spring相关的外文文献和翻译(含出处).zip
麻雀搜索算法(SSA)优化bp网络
python大作业--爬虫(完美应付大作业).zip
故障诊断数据集及实现代码
基于蒙特卡洛生成电动汽车充电负荷曲线程序
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
基于VMD算法的信号降噪.rar
基于STM32的FFT频谱分析+波形识别
多智能体的编队控制matlab程序(自己编写的,可以运行)
最新下载
医院核心业务系统密码应用建设方案(2023版).pdf
微信小程序开发合同签订.docx
Delphi 12 控件之Delphi 12.2 中英文一键切换助手(含操作说明)- 适用 29.0.53571.9782.ra
maven jar包
管调通V2.15.apk
IPv4 CIDR地址计算器
虚拟声卡 Virtual Audio Cable V4.10(无女trail音+原理说明)
Matlab 薛定宇教授 Ctrllab3.1 工具箱
中国科学院大学模式识别期末考试复习资料+题目
《魔塔》游戏c++源代码
其他资源
EPPlus 4.5.3.1
医院预约挂号系统用例图
数据可视化驾驶舱20套源码.rar
matlab的SVM工具包
微电子器件PPT(陈星弼版).zip
HC6800-EM3 V2.0光盘资料
嗜睡的理发师进程同步与实现(c++)
安卓小应用源码(android studio).zip
jsp+servlet 网上书城系统 全套源码+精美页面
MATLAB绘制2维数据点程序,用于显示聚类结果,能够以不同颜色和形状显示不同类别的数据点
3.5.实现声音播放
HD66773_V0.1_20020601.pdf
聚合物光折变材料聚乙烯咔唑的陷阱态研究
dlib_Model.zip
常用模型算法(Matlab).rar
pentaho kettle solutions电子书及完整源码
海康标定工具
基于VC+opencv的人脸识别(识别出五官)
运行时缺少MSVCP60D.DLL?
C# 堆栈 回溯 马踏棋盘演示程序
PSASP7.0版用户自定义(UD)模型手册
关于磁致伸缩位移传感器的应用
PPPOE批量测试拨号
VS2008 SP1 无法显示中文智能提示 解决方案包