闲话 QQ 空间爬虫,基于 selenium 模拟登录空间,拿到 cookies,然后使用 requests 抓取好友留言板的所有留言与回复,并生成词图。只抓了留言,本来还想抓说说,不过因为我已经好多年不玩 QQ 空间,感觉它对我已经没什么意义了,遂作罢。 演示 这是我初中老号的留言板词云图,这个号已经弃用很多年了,里面黑历史满满,回忆满满,时间过得真他妈快。 使用 获取源码 $ git clone https://github.com/luolongfei/qzone_spider.git qzone_spider/ $ cd qzone_spider/ 安装依赖包 $ pip install -r requirements.txt 配置 # 复制配置 $ cp .env.example .env # 根据 .env 文件中的注释,将其中对应的项目改为你自己的 $ vim .env 抓取
2021-10-16 16:45:20 4.44MB selenium python3 qzone-spider Python
1