爬虫,爬取微信文章,设置多账号,可以解决被封号问题使用技术点:
python,selenium(每次登录),mysql,ORM 框架SQLAlchemy,BeautifulSoup,lxml,apscheduler
注意:
1.需要配置爬取数量和每次爬取数量 2.第一次登录需要调用login函数扫码,存储在本地的cookies文件,需要转移到cookies文件夹中,该设置的目的后期优化多公众号爬取,突破每天能爬取次数的限制
3.selenium需要设置一个目录文件夹下对应chrome版本的chromedriver.exe