利用WebClient爬取古诗文网诗词,获取指定页的所有代码,截取转向的路径,拼接子页,获取子页数据,然后存入数据库
2022-12-15 20:26:41 331KB C# 爬虫 正则表达式
1
利用python3的requests请求库和re正则表达式模块,爬取猫眼电影排行,并存储到MySQL数据库中。
1
利用sorted()函数进行人气值排名,按照关键词k进行检索,通常是将人气值利用正则表达式将数字输出出来,通常取正则表达式输出列表的0号位置置换成浮点型即可,但是随着人气值超过1000万,如1200万人气,在正则表达式输出时会是‘1,200万’,但是此时转换成浮点数,只会输出‘1’,不能识别‘,’后边的‘200万’,采用新方法if()函数使其合理化。
2022-02-07 14:45:21 3KB 爬虫;正则表达式
1