1 导入需要的库
import json #用于json格式数据的转换
import re #正则表达式
import requests #用于爬取网页的内容
import datetime #时间库
2 查看当前时间(设计爬取存储文件名)
today = datetime.date.today().strftime('%Y%m%d') #20200315
today
'20200401'
type(today) #建议初学者对每个数据查看一下数据类型
str
3 爬取网页
3.1 访问网页
丁香园地址:https://nc
1