爬的这个页面 http://m.sinovision.net/newpneumonia.php
爬虫三步走:下载数据、解析数据、持久化数据
使用requests库下载,BeautifulSoup库解析,csv库存储
代码:
import requests
from bs4 import BeautifulSoup
import csv
import time
class DataScrapyer:
def __init__(self):
self.headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) App
1