google_search:利用python selenium模块来爬取Google搜索结果,在源代码的基础上做了些修改-源码

上传者: 42116794 | 上传时间: 2021-09-23 11:20:15 | 文件大小: 4.14MB | 文件类型: ZIP
#google_search ##作用:利用python selenium模块来爬取谷歌搜索结果,在源代码的基础上做了些修改 ##相关文件说明: google-web-search.py​​:从Google抓取某个关键字的所有结果,以“ [debug]标题”;链接”显示,以一条链接一行的格式保存。 google-web-search-state-crawler.py:从Google抓取某个关键字的结果数,即提取类似“找到约1,130,000条结果”中的数字。#没试过 result-crawler.py:从Google返回的结果链接中抓取文本。注意只会处理网页和pdf文件。(pdf的下载处理貌似有点问题,可能需要再改一下。)#没试过 ##使用方法: #使用python2 + selenium + firefox profile 实现的随机user agent 模拟抓取Google搜索结

文件下载

资源详情

[{"title":"( 15 个子文件 4.14MB ) google_search:利用python selenium模块来爬取Google搜索结果,在源代码的基础上做了些修改-源码","children":[{"title":"google_search-master","children":[{"title":"geckodriver-v0.16.1-win64","children":[{"title":"geckodriver.exe <span style='color:#111;'> 5.71MB </span>","children":null,"spread":false}],"spread":true},{"title":"geckodriver-v0.16.1-win64.zip <span style='color:#111;'> 2.07MB </span>","children":null,"spread":false},{"title":"google_web_search.py <span style='color:#111;'> 587B </span>","children":null,"spread":false},{"title":"core.py <span style='color:#111;'> 5.80KB </span>","children":null,"spread":false},{"title":"readme.md <span style='color:#111;'> 1.73KB </span>","children":null,"spread":false},{"title":"geckodriver.log <span style='color:#111;'> 5.45KB </span>","children":null,"spread":false},{"title":"keywords.txt <span style='color:#111;'> 352B </span>","children":null,"spread":false},{"title":"goole_api_search.py <span style='color:#111;'> 428B </span>","children":null,"spread":false},{"title":"proxy_chrome.py <span style='color:#111;'> 2.89KB </span>","children":null,"spread":false},{"title":"keywords_remain.txt <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"core.pyc <span style='color:#111;'> 5.54KB </span>","children":null,"spread":false},{"title":"google-add.txt <span style='color:#111;'> 4.57KB </span>","children":null,"spread":false},{"title":"test_file.py <span style='color:#111;'> 2.29KB </span>","children":null,"spread":false},{"title":"firefoxtest.py <span style='color:#111;'> 221B </span>","children":null,"spread":false},{"title":"useragent.txt <span style='color:#111;'> 2.57KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明