只为小站
首页
域名查询
文件下载
登录
使用动态IP池+cookie爬取豆瓣
豆瓣影评
数据
使用动态IP池+cookie爬取豆瓣
豆瓣影评
数据
2021-10-18 15:07:49
3.11MB
豆瓣
影评
1
一个模仿
豆瓣影评
的微信小程序源码.zip
一个模仿
豆瓣影评
的微信小程序源码.zip
2021-08-09 09:09:02
45.07MB
小程序
资源达人分享计划
Python应用实战代码-Python爬取
豆瓣影评
-分析挖掘用户与电影之间的隐藏信息
Python应用实战代码-Python爬取
豆瓣影评
-分析挖掘用户与电影之间的隐藏信息
2021-07-21 12:04:18
791KB
爬虫
Python
用户画像
豆瓣20万条影评数据集.txt
本宝宝采集的豆瓣20万条影评原始数据集,希望大家积极下载,尊重宝宝的劳动成果,后期有时间我还为大家提供数据集哈。 机器学习,nlp,深度学习的宝宝赶快看过来,看过来哈。 数据集格式: title##star##comment 电影名称##评论星级(1-5星)##评论内容
2021-07-15 21:45:58
19.93MB
nlp
情感分析
豆瓣影评
影评数据
1
爬取
豆瓣影评
、清洗、jieba分词、做词云图
爬取
豆瓣影评
、清洗、jieba分词、做词云图 本程序主要分为3个过程。 1、抓取网页数据 使用Python爬虫技术获取豆瓣电影中最新上映电影的网页,其网址如下: https://movie.douban.com/cinema/nowplaying/qingdao/ 正在上映的电影 每个电影的ID和名称 通过其HTML解析出每部电影的ID号和电影名,获取某ID号就可以得到该部电影的影评网址,形势如下: https://movie.douban.com/subject/26900949/comments https://movie.douban.com/subject/26871938/comments 其中,26900949、26871938就是电影《天使陷落》、《灭绝》的ID号,这样仅仅获取了20哥影评,可以指定开始号start来获取更多影评,例如: https://movie.douban.com/subject/26900949/comments?start=40&limit=20 这意味着获取从第40条开始得20个影评。 2、清理数据 通常将某部影评信息存入eachCommentList列表中。为便于数据清理和词频统计,把eachCommentList列表形成字符串comments,将comments字符串中的“也”“太”“ 的”等虚词(停用词)清理掉后进行词频统计。 3、用词云进行展示 最后使用词云包对影评信息进行词云展示。
2021-06-23 19:07:33
9.91MB
jieba
清洗
词云图
豆瓣影评
2万多条豆瓣电影评论数据
豆瓣影评
数据,21000多条,包括movie_name, user_name, score, comment, date等字段,只需简单处理就可使用。
2021-03-08 13:06:37
5.59MB
nlp
情感分析
豆瓣影评
1
豆瓣影评
数据集
豆瓣5万条影评原始数据集,机器学习,nlp,深度学习的宝宝赶快看过来,看过来哈。 数据集格式: title,star,comment,label是对应电影名称,评论星级(1-5星),评论内容,差评好评(星级大于3为好评)
2019-12-21 22:02:04
9.76MB
NLP
1
Python项目案例开发从入门到实战源代码第20章 词云实战——爬取
豆瓣影评
生成词云
Python项目案例开发从入门到实战源代码第20章 词云实战——爬取
豆瓣影评
生成词云
2019-12-21 21:26:25
607KB
python
1
豆瓣电影数据集12万+用户影评40万+爬虫程序.zip
使用python语言实现的豆瓣电影数据搜索下载程序,包含数据文件和源代码
2019-12-21 21:12:17
42.47MB
python
豆瓣影评
1
抓取
豆瓣影评
并制作词云
爬取豆瓣电视剧天盛长歌影评,并去掉其中的停止词,生成词云,
2019-12-21 19:30:37
6KB
python爬虫
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
CNN卷积神经网络Matlab实现
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
DBSCAN算法Matlab实现
BP神经网络+PID控制simulink仿真
DirectX修复工具V4.1增强版
科研伦理与学术规范 期末考试2 (40题).pdf
pytorch实现RNN实验.rar
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
华为OD机试真题.pdf
多智能体的编队控制程序的补充(之前上传少了一个文件)
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
Python+OpenCV实现行人检测(含配置说明)
Android大作业——网上购物APP(一定是你想要的)
基于matlab扩频通信系统仿真(整套代码)
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
最新下载
清华同方X46H刷新BIOS工具
时间数字转换(TDC)的Vivado工程文件
银安YADR-001身份证读卡器驱动 v3.0 官方版
配套程序和数据_量化投资-MATLAB数据挖掘技术与实践
Acer V3-571G 越级升级bios
高级ASIC芯片综合
掌讯 YT9218 20200408 升级系统包
windows下解包/打包boot/recovery.img的工具bootimg.exe
Long RuanGIS3.5版2022年6月7日全网最新
有害气体检测
其他资源
2015年SCI期刊影响因子和中科院最新分区
图像水表指针识别,水表的指针识别,便于读取水表上的读数
C#/halcon字符检测/GUI
JTable数据库基本操作多行增删改查
glibc-2.14.1所有的rpm包
web大作业.rar
web页面软电话示例
win10应用商店独立安装包
超实用控件Iocomp version4破解版
自适应分数阶偏微积分去噪
PZ-OV7670摄像头模块--STM32F1测试程序.rar
kmeans算法-采用c#实现
C# 微信公众平台开发.NET源码
2020美团技术年货-合集(前端+后台+数据+算法+运维).pdf
H12-221.pdf
FreeRTOS实时内核使用指南_中文.pdf
00IC XDS100USB仿真器使用说明书.pdf
教师招考教资考试教育学有关名人及理论快速记忆.pdf
gradle-5.x.all.zip,懂的下载,保证你满意而归
2020牛客多校暑期集训营第八场题解.pdf
Droidcam亲测可用版
win embedded compact 2013开发教程
人才招聘网站源码