上传者: 38519387
|
上传时间: 2021-10-27 16:45:30
|
文件大小: 434KB
|
文件类型: -
本人小白一枚,简单记录下学校作业项目,代码十分简单,主要是对各个库的理解,希望能给别的初学者一点启发。
一、项目要求
1、程序可以从北京工业大学首页上爬取新闻内容:http://www.bjut.edu.cn
2、程序可以将爬取下来的数据写入本地MySQL数据库中。
3、程序可以将爬取下来的数据发送到邮箱。
4、程序可以定时执行。
二、项目分析
1、爬虫部分利用requests库爬取html文本,再利用bs4中的BeaultifulSoup库来解析html文本,提取需要的内容。
2、使用pymysql库连接MySQL数据库,实现建表和插入内容操作。
3、使用smtplib库建立邮箱连接,再使