用IE提取网页资料的好处在于:所见即所得,网页上能看到的信息一般都能获取。 本工具功能不多,主要是便于提取网页上展示的信息所在元素的代码。希望能对大家有点小帮助。 网页抓取小工具.rar (22.91 KB, 下载次数: 3601) 本工具使用方法: 1、在B1内输入网址,可以是已打开的网页,也可以是未打开的 2、A2和B2的内容不要更改,第二行的其他单元格可以自行输入元素的各属性名称。其中,innertext单元格有下拉选项 3、点击“开始分析”分析网页元素。 4、A列是各元素的对象代码。 5、在innertext列查找所需提取的内容后,选定该行,点击“生成excel”。 可以提取Table标签的表格或下载IMG标签的图片。 6、在新生成的excel里,点击“执行代码”按钮,看是否能生成所需数据。 如果生成的数据和开始分析的数据不符,原因可能是: 1、网页未完全加载完毕,对应标签的数据尚未加载,代码自动提取了其后的标签数据。 可能的解决方法:加上do...loop时间延迟。 2、网页为动态网页,标签的序号不定。 可能的解决方法:元素有id名的话用getelementbyid("id名")名获取,没有的话抓包换xmlhttp法提取吧。 3、需要选择相关选项或需要登录才能提取。 可能的解决方法:先做登录或选择相关选项等操作后再提取
2021-11-26 13:18:39 27KB 网页元素代码抓取
1
本篇文章给大家介绍了Python selenium自动化网页抓取器的实例应用以及知识点分析,有需要的参考学习下。
2021-11-26 12:26:04 75KB Python selenium 网页抓取
1
天天自动抓取更新系统全智能抓取,多个网页,多个站点爬取,智能分析数据,有更新才入库。模拟搜索引擎爬取网页,成功率90%以上。实时通知,数据有更新实时邮件/微信通知。无需人工手动操作,一旦启动会不断Push。模拟搜索引擎爬取网页,成功率非常高。不用时刻坐在电脑前刷新网页,数据自动获得。经过差不多一年的实际生产环境测试和应用,软件正式面向市场了。 支持新闻列表,论坛帖子,招标信息,商品上新,股市财经信息,微博更新等各种网站平台的抓取监控,通用的网页列表监控软件。 监控网站信息列表,当出现更新或满足关键字条件时,立即提醒并记录。帮助你从海量的网络资讯中捞取有用资讯,第一时间得到最精准的资讯信息。最适合广大股民或新闻工作爱好者使用。 天天自动抓取更新系统功能特点:  1、软件具备更新监控与关键链接过滤功能。  2、更新监控指当网站出现新的资讯链接时会抓取入库,不重复提醒。  3、软件支持同时监控多个网站,获取信息更全面。  4、抓取数据入库,随时打开查阅。  5、支持常用提醒方式,包括邮件/微信等。  6、一般网站使用源码监控方式,速度快节省资源。
1
WPF-Automatic-Crawler 这是一款带UI界面的自动化采集爬虫,内部使用了WebKit浏览器内核,以实现对Ajax动态加载数据的采集。整个软件采用策略设计模式,可非常灵活的通过编写多个策略类来定义数据的抓取方式及内容。
2021-11-24 12:37:44 150KB
1
百度地图自动搜索商户并抓取商户信息,可定位,商户信息自动保存至桌面
2021-11-23 21:44:34 1.34MB 百度地图 商户信息抓取
1
dianping scrapy抓取数据存储至本地mysql数据库 基于python开发,采用scrapy,数据存储至本地数据库(或excel表格) 程序的主要目的是完成抓取和分析的任务同时学习爬虫相关知识,所以在细节处理上略有不足,但考虑到最终的目的是记录自己的学习,另外帮助到他人学习,所以这些细节无关紧要(毕竟不是面向用户的程序)。 程序还有建立商家-用户点评的表格还在进行中... 也许你可以在这里找到一些帮助,比如:一次返回两个,多个item,切割中文,中文转数字等问题 1)一次返回两个、多个item 在pipelines.py文件中,可以看到。如果是不同的spider返回的,直接根据spider的name来判断即可 elif isinstance(item, User_shopItem): 2)而一个spider返回两个、多个item,则通过item的name来判断(item的
2021-11-23 14:38:23 3.69MB Python
1
非常适合学习RTMP协议及加解密的朋友 优化了之前发布的rtmp client程序 1 使用hmac进行三次握手,解决不发送h264流的问题 2 支持 Aggreagte支持 3 加入心跳时间,同步服务服务时间 使用说明: 1 vs2008 2 安装OpenSSL 有问题可以联系我: 277787043
2021-11-23 08:34:21 62KB rtmp handshake rtmp学习 rtmpclient
1
cartoonDataShow 从各大动漫网站抓取到数据后存储在mongodb中,然后用python(flask)提供的路由和接口,在前端用react + echarts进行数据展示 运行环境python3.4,mongodb 配置方法: Windows用户可以在目录下执行python -m venv flask,得到flask框架然后再通过flask \ Scripts \ activate.bat或flask \ Scripts \ activate进入virtualenv虚拟环境。 执行npm install,安装js依赖包,再执行pip install -r requirements
2021-11-23 01:14:43 1.64MB react flask react-router mongodb-python
1
1)抓取框架由python编写,简单易用:可批量将tushare数据抓取到本地数据库中,用于量化交易算法分析,避免大量精力消耗在数据准备上。 2)框架下载后即可使用:包含股票、基金日线行情、证券信息、交易日历等接口抓取代码,框架会自动按照设置的日期段将数据落地到本地数据库。 3)免除tushare各种数据接口调用和数据行数限制:适配各个数据接口的抓取限制,实现批量抓取任意日期长度的历史数据。 4)框架简单易用易于扩展:架构清晰简洁,小白也很容易上手,可快速扩展数据接口。 5)使用前先申请tushare账号,获取token填入constant.proToken 。 6)原创不易,启用且珍惜,如有疑问,站内联系。
2021-11-22 22:02:46 4.98MB 量化交易 tushare 程序化交易 python
泛华Flash抓取工具,下载网页上的flash文件。
2021-11-22 20:14:18 1.44MB Flash
1