压缩包内包含已爬取成功的全部信息和完整代码,导入后即可使用
已爬取的信息:全部的省份,全部的学校以及其全部专业的院系所和研究方向,以及招生人数和考试科目。
使用的库:from bs4 import BeautifulSoup
import requests
import re
from openpyxl import Workbook
简介:
该代码是逐步选择所在省市和学科类别,爬取到了招生单位中每个学校的链接。再通过该学校链接获得其考试范围的链接,最后爬取考试范围的链接中包含的我们所需要的信息,信息包括:院系所、专业、研究方向、拟招人数以及考试范围
1