雅虎
用于抓取 Yahoo 页面的 Python 实用程序
yahooscraper 包被组织成模块和子模块。 每个叶模块(即没有子模块的模块)包含的函数采用单个参数——由模块表示的页面的 HTML 文本及其命名空间——并返回一些从页面解析的数据。
如果未找到数据,则返回None 。 或者,在应该返回可迭代对象的情况下,可能会返回一个空的可迭代对象。
每个叶子模块还包括一个url()函数,该函数返回该模块所代表的页面的 URL。 在模块表示一组 URL 的情况下,此函数采用参数。
要从需要身份验证的页面获取数据,首先使用login模块的authenticated_session()方法函数获取经过身份验证的会话。
使用 pydoc 查看更详细的 API 文档:
$ pydoc yahooscraper
$ pydoc yahooscraper.login
$ pydoc ya
2022-04-09 11:45:29
7KB
Python
1