上传者: 42118770
|
上传时间: 2022-01-06 19:34:40
|
文件大小: 14KB
|
文件类型: -
中国地区
这是一个基于Python语言编写的爬虫项目,针对中国省市区以及镇,街道,村,居委会等共5级行政区域数据的获取并写入excel文件
等级
一级:省,直辖市,自治区
二级:地级市
三级:市辖区,县(旗),县级市,自治县(自治旗),特区,林区
四级:镇,乡,民族乡,县辖区,街道
五级:村,居委会
本项目仅做学习交流用途
运行程序
依赖Python3环境
项目根目录执行pip install -r requirements.txt
环境安装好后,建议直接导入项目到PyCharm中运行
推荐使用单线程爬取,虽然速度慢,但是不容易被反爬
运行项目根目录下main.py文件
棉类参数说明:
"""
year: 要爬取的年份,默认2020
encoding: 编码,默认gb2312
province_code_list: 可爬取指定的一级行政区数据,为空时爬取全国一级行政区,否则爬取指定代码的