上传者: 38656989
|
上传时间: 2021-11-24 16:52:47
|
文件大小: 49KB
|
文件类型: -
用Python进行爬取网页文字的代码:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import requests
import re
# 下载一个网页
url = 'https://www.biquge.tw/75_75273/3900155.html'
# 模拟浏览器发送http请求
response = requests.get(url)
# 编码方式
response.encoding='utf-8'
# 目标小说主页的网页源码
html = response.text
print(html)
1、编写爬虫思路:
确定下载目标,找到网页,找到网