文章目录一.了解页面信息二.爬取数据代码三.获取数据结果 一.了解页面信息 这里我们以酷狗音乐古风榜为例 由此可见我们需要我曲目和歌手的信息都在框住的class里面 二.爬取数据代码 #导入requests和BeautifulSoup库 import requests from bs4 import BeautifulSoup url = "https://www.kugou.com/yy/rank/home/1-33161.html?from=rank" #获取所有网页信息 response = requests.get(url) #利用.text方法提取响应的文本信息 r=request
2021-11-28 09:58:10 227KB fu IF request
1
输入链接采集1688和某宝的详情图片和视频;python的BeautifulSoup库
2021-11-09 17:13:08 1KB python 采集
基于Python的selenium库 + FireFox webdriver实现模拟登录;Request库和BeautifulSoup库进行网页爬取;time库实现消息定时更新;openpyxl库实现将爬取数据写入excel。代码注释详细(一看就懂),附带geckodriver.exe、1000条脱壳区信息(发布人、发布时间、发布题目、发布内容、前十评论人、时间、评论内容)、10条热点贴信息(发布人、发布时间、发布题目、发布内容、前十评论人、时间、评论内容)。