详细介绍c#开发的网络爬虫代码的源文件.入门级学者可下载学习
2023-12-20 05:03:07 4.77MB c#网络爬虫 网络蜘蛛 搜索引擎蜘蛛
1
本文主要利用tesseract识别网页登陆中的验证码(从图像的角度,不是Cookie) 很多人对CAPTCHA(验证码)很熟悉,但是很少有人知道其含义:全自动区分计算机和人类的图灵测试。通俗的讲就是是一种区分人和人工智能程序的方法。很多的网页都设置了验证码,常见的就是由“字母数字”组成的图片,如下: 本文的代码是利用selenium模拟浏览器的运行,识别登陆界面的验证码,分割验证码的区域然后识别验证码(光学字符识别)。 # -*- coding: utf-8 -*- """ Created on Sun Apr 26 17:42:23 2020 @author: dell """ impor
2023-01-11 06:36:58 62KB 爬虫 网络爬虫 验证码
1
XposedInstaller(xposed框架)是一款可以在不修改APK的情况下影响程序运行(修改系统)的框架服务,基于它可以制作出许多功能强大的模块,且在功能不冲突的情况下同时运作。
2022-10-31 16:32:25 32.1MB Xposed app 爬虫 https
1
谁说只有Python才能写爬虫的,C++也可以,本代码包括以下几个知识点: 1、gcc环境下静态链接 2、正则表达式的使用 3、文件流的使用 4、对反爬机制的一些避免思路 5、std::vector的使用 6、C++网络编程 适合人群:有一定C++基础,爱好C语言编程的人群。 采用的集成开发环境:code blocks 采用的编译器:gcc 本人亲测正常运行而且效果还不错,欢迎大家下载,交流共同进步。 注意:本代码只限于学习交流,不可用于任何违法行径,另如果代码有问题,可以与笔者联系,留言即可。
2022-10-06 22:24:35 862KB c++ 爬虫 网络编程 gcc/gdb编译调试
1
提取,编辑和轻松评估XPath查询。 XPath的助手很容易提取,编辑,并在任何网页评估XPath查询。 重要提示:安装此扩展后,必须重新加载任何现有的选项卡或重新启动Chrome浏览器扩展工作。 说明: 1.打开一个新的标签,并导航到任何网页。 2.按Ctrl-Shift键-X(或OS X命令移-X),或单击工具栏上的XPath的助手按钮,以打开XPath助手控制台。 3.按住Shift键将鼠标悬停在页面上的元素。查询框将不断更新,以显示鼠标指针下方的元件XPath查询,结果框将显示当前查询的结果。 4.如果需要,请在控制台直接编辑XPath查询。结果框会立即反映更改。 5.重复步骤(2)关闭控制台。 如果控制台在你的方式获得,按住Shift键,然后将鼠标移动到它; 它会移动到页面的相对侧。 一个忠告:当渲染HTML表格,浏览器插入人工标记到DOM,这将在随后通过该扩展提取查询显示出来。 Extract, edit, and evaluate XPath queries with ease. XPath Helper makes it easy to extract, edit, and evaluate XPath queries on any webpage. IMPORTANT: After installing this extension, you must reload any existing tabs or restart Chrome for the extension to work. Instructions: 1. Open a new tab and navigate to any webpage. 2. Hit Ctrl-Shift-X (or Command-Shift-X on OS X), or click the XPath Helper button in the toolbar, to open the XPath Helper console. 3. Hold down Shift as you mouse over elements on the page. The query box will continuously update to show the XPath query for the element below the mouse pointer, and the results box will show the results for the current query. 4. If desired, edit the XPath query directly in the console. The results box will immediately reflect your changes. 5. Repeat step (2) to close the console. If the console gets in your way, hold down Shift and then move your mouse over it; it will move to the opposite side of the page. One word of caution: When rendering HTML tables, Chrome inserts artificial tags into the DOM, which will consequently show up in queries extracted by this extension.
2022-08-14 10:19:00 247KB XPath XPath-Helper 爬虫 网络
1
JustTrustMe是Github上的一个开源工程,他是一个Xposed模块,用来禁止SSL证书验证。以下是其简介。 JustTrustMe:An xposed module that disables SSL certificate checking. This is useful for auditing an appplication which does certificate pinning.
2022-03-22 11:06:44 11KB JustTrustMe 破解 app 爬虫
1
Python网络爬虫技术-源代码和实验数据
2021-12-31 20:04:52 2.24MB Python 爬虫 网络爬虫 源代码
1
网络爬虫(以豆瓣为例) 1,应用pip install 命令语句安装环境。该步骤主要是在python原环境之后为自己提供一个比较和谐以及习惯的环境。如果习惯python原环境或是其他操作环境的朋友和忽略此操作,或是安装自己喜欢的环境进行操作。完成环境安装操作之后进入控制台根目录下输入jupyter notebookb并按下回车键后便可进行网络爬虫的具体操作了。注:新手朋友需注意一个小细节,控制台不能关闭,否则无法新建代码文件,笔者最初可是被这个小问题给绊倒过哦。 2,分析目标网站的网址结构,为数据的全面爬取提供便利。具体步骤如下: 然后利用简单的循环语句爬取目标网站的全部网址。 for pa
2021-12-06 19:44:43 218KB 爬虫 网络爬虫 豆瓣
1
python网络应用开发 实验报告
2021-11-12 14:05:22 305KB python 爬虫 网络应用开发
python网络应用开发 实验报告
2021-11-12 14:05:22 418KB python 爬虫 网络应用开发