免责声明
此抓取工具作为公共服务提供,因为 Glasdoor 没有用于评论的 API。 Glassdoor TOS 禁止抓取,我不保证如果您使用此程序,您的帐户将不会被禁止。 此外,如果 Glassdoor 联系我要求删除此存储库,我会立即这样做。
介绍
您是否曾经想从 Glassdoor 上抓取评论,但又为该网站缺乏用于评论的公共 API 感到遗憾? 不用担心! 该脚本将浏览一页又一页的评论,并将评论数据抓取到一个整洁的 CSV 文件中。 将其传递给公司页面,并设置刮刮最方便的25条评论的限制,或控制诸如刮擦的评论数和最大/最小评论发布日期之类的控制选项。
每条评论大约需要 1.5 秒才能抓取。 因此,抓取 1,000 条评论大约需要 25 分钟,或者抓取 10,000 条评论需要 4 多小时。 这个脚本需要耐心。 :beaming_face_with_smiling_eyes:
安装
首先,确保您使用的是 Python 3。
克隆或下载此存
2021-06-22 21:45:48
8KB
Python
1