系统环境:python3.8.12 ,编译器: Jupyter notebooks
目录介绍
https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/EKQYvg.png
爬取过程
1. 抓取热映电影的网页内容
2. 爬取评论
3. 清洗数据
4. 使用结巴分词进行中文分词
5. 去掉停用词
6. 统计词频
7. 用词云进行展示
词云图
暗恋·橘生淮南 (2022)
https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/luJwZo.png
豆瓣热映 https://cdn.jsdelivr.net/gh/EverettSy/ImageBed@master/uPic/SBRvJn.png
1