上传者: 38595689
|
上传时间: 2022-03-17 16:44:17
|
文件大小: 104KB
|
文件类型: -
扫描器需要实现的功能思维导图
爬虫编写思路
首先需要开发一个爬虫用于收集网站的链接,爬虫需要记录已经爬取的链接和待爬取的链接,并且去重,用 Python 的set()就可以解决,大概流程是:
输入 URL
下载解析出 URL
URL 去重,判断是否为本站
加入到待爬列表
重复循环
SQL 判断思路
通过在 URL 后面加上AND %d=%d或者OR NOT (%d>%d)
%d后面的数字是随机可变的
然后搜索网页中特殊关键词,比如:
MySQL 中是 SQL syntax.*MySQL
Microsoft SQL Server 是 Warning.*mss