上传者: 42166623
|
上传时间: 2021-12-24 10:13:21
|
文件大小: 5.47MB
|
文件类型: -
国家统计用区划代码和城乡划分代码---源码、详细分析、数据
2019.05.25更新:
添加了爬虫代码使用说明
添加了依赖requirements.txt
2018.12.02更新:
修改,添加了中山市/东莞市下面没有区级单位的异常处理
页面源码的编码为GB2312,实际为GBK,因此手工指定编码为GBK:
2018.11.30更新:
更新village.csv文件,按照code顺序从小到大排列,看起来更方便
更新数据总结中的错误
2018.11.10更新:
缺失数据补充:
一、本仓库介绍
统计局网站提供的按照:省-市-县-镇-村这样的层次关系来组织页面。统计局的网站对于爬虫的限制也不多,我只使用一个ip就爬取全部数据,爬取的过程中请求被拒绝的情况很少。
本仓库包含:
代码文件:
2016年统计用区划代码和城乡划分代码数据文件:
页面分析、代码详细说明见个人博客:
Pytho