天眼查爬取企业信息-企业信用信息查询系统-天眼查爬虫

上传者: Mrrunsen | 上传时间: 2023-03-08 21:20:36 | 文件大小: 29.87MB | 文件类型: ZIP
运行main_all.py即可爬取90%的天眼查公司 运行main_top100.py只爬取96个行业的前100家公司 运行main_search.py根据你的公司名搜索进行爬取指定公司 注意: 1,代理IP请自费或自力更生建免费IP池 2,本项目自带云数据库,可直接使用,用你的电脑直接加入爬虫计划,我愿称之为 “分布式”爬虫 3,如果想用自己的数据库,配置信息在 config.py里 修改为你的数据库和蘑菇代理appkey即可 4,此程序随时可停,随时可继续从上次停止的地方开始,不会重复爬取 5, 如果有其他问题,或者想要数据,加Q群: 231436610 步骤1: 查看data文件夹,看数据是否满足你的数据分析要求。 公司信息.xlsx 超过2万条的企业信息 行业TOP100.sql 各个行业Top100的企业信息 大概9000条记录。 步骤2: 如果数据不满足你的要求,你想操练一下,花点钱爽爽。 安装好mysql,建好表,sql文件夹下有建表脚本。 买好蘑菇代理或者其他代理池的代理 修改config.py 里面的配置,与数据库配置以及蘑菇代理API 的a

文件下载

资源详情

[{"title":"( 26 个子文件 29.87MB ) 天眼查爬取企业信息-企业信用信息查询系统-天眼查爬虫\n\n","children":[{"title":"tianyancha-master","children":[{"title":"tianyancha.zip <span style='color:#111;'> 10.13MB </span>","children":null,"spread":false},{"title":"sql","children":[{"title":"tianyancha.sql <span style='color:#111;'> 4.74KB </span>","children":null,"spread":false},{"title":"表头.xlsx <span style='color:#111;'> 9.82KB </span>","children":null,"spread":false}],"spread":true},{"title":"src","children":[{"title":"main_top100.py <span style='color:#111;'> 2.91KB </span>","children":null,"spread":false},{"title":"main_all.py <span style='color:#111;'> 7.48KB </span>","children":null,"spread":false},{"title":"main_search.py <span style='color:#111;'> 9.59KB </span>","children":null,"spread":false},{"title":"get_html.py <span style='color:#111;'> 6.06KB </span>","children":null,"spread":false},{"title":"mysql.py <span style='color:#111;'> 8.07KB </span>","children":null,"spread":false},{"title":"find_page.py <span style='color:#111;'> 1.71KB </span>","children":null,"spread":false},{"title":"find_info.py <span style='color:#111;'> 9.17KB </span>","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"mysql.cpython-36.pyc <span style='color:#111;'> 3.17KB </span>","children":null,"spread":false},{"title":"find_page.cpython-36.pyc <span style='color:#111;'> 898B </span>","children":null,"spread":false},{"title":"find_info.cpython-36.pyc <span style='color:#111;'> 3.45KB </span>","children":null,"spread":false},{"title":"get_html.cpython-36.pyc <span style='color:#111;'> 2.33KB </span>","children":null,"spread":false}],"spread":true},{"title":"industry.py <span style='color:#111;'> 8.39KB </span>","children":null,"spread":false},{"title":"find_industry.py <span style='color:#111;'> 829B </span>","children":null,"spread":false},{"title":"config.py <span style='color:#111;'> 907B </span>","children":null,"spread":false}],"spread":false},{"title":"data","children":[{"title":"行业TOP100.sql <span style='color:#111;'> 15.52MB </span>","children":null,"spread":false},{"title":"公司信息.xlsx <span style='color:#111;'> 7.21MB </span>","children":null,"spread":false},{"title":"行业TOP100.xlsx <span style='color:#111;'> 4.04MB </span>","children":null,"spread":false},{"title":"7万条企业信息.csv <span style='color:#111;'> 23.56MB </span>","children":null,"spread":false}],"spread":true},{"title":"LICENSE <span style='color:#111;'> 11.44KB </span>","children":null,"spread":false},{"title":"html","children":[{"title":"industry_list.html <span style='color:#111;'> 332.48KB </span>","children":null,"spread":false},{"title":"company_list.html <span style='color:#111;'> 0B </span>","children":null,"spread":false}],"spread":true},{"title":".gitignore <span style='color:#111;'> 37B </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 1.69KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明