上传者: 38741030
|
上传时间: 2021-12-19 18:15:50
|
文件大小: 108KB
|
文件类型: -
b站的评论由js加载,所以我们有两种方法获取,
第一种用selenium,拖拽导航条,刷新出评论再抓取(效率低且代码量大)
第二种直接找到js接口去获取数据
先说下我一开始的思路
我刚开始不确定是xhr还是js,所以现在xhr中找,发现并没有,于是搜索了js,发现在这个接口里
page代表页数和评论数量,replies是所有评论的内容
于是我们开始分析这个接口的参数
刚开始我以为callback是js加密,后来发现这个参数加不加效果是一样的,
多次试验后发现只有pn,type,oid,sort是必须的
pn是当前页数
type默认为1,作用未知
oid是视频的id
sort是排序
我这边直