Python从雪球爬取股票信息,获取A股大盘的ROE、PE、PB等数据,获取A股总市值、总资产、总利润、市净率、净资产收益率
2024-04-10 10:40:19 9KB Python 股票爬虫
1
智联招聘爬虫,可以根据地区与搜索的内容进行爬取数据,整个文件夹中包括代码与说明书,说明书足够详细,该代码是我做数据分析时实打实写出来的,主打一个好使。这个爬虫主要由selenium与Python来实现,并且该selenium可以在正常模式与handless模式(无头模式)之间进行更改。相关浏览器(谷歌)所需的插件也在文件中所包含。而核心代码由两部分构成:标签页、详情页。我将其分成了两个部分,方便理解,如果想要爬取完整的智联招聘的数据,需要先试用main.py中的标签页代码来爬取数据,然后再使用详情页的代码文件 来爬取详情页的信息。可以完整爬取下来的数据列包括:公司名称、公司地址、公司规模、招聘工资、招聘标签、 详情页链接、详情页内容等等。简单高效。 截止到2024年1月30号,代码仍然可以正常使用,详细的操作步骤已经在文档中的说明书中说明清楚。文档中还包括一份该爬虫的逻辑分析图,方便使用者理解该爬虫的结构,并且能够再此基础上对代码进行更新,能够进行爬取其他的网站。 该代码仅用于学习目的,方便对数据的爬取,不能用于其他的用途,非常感谢。
2024-04-01 18:38:44 7.62MB selenium 爬虫
1
scrapy + DrissionPage 爬取数据
2024-03-26 22:46:42 11KB scrapy python 爬虫
1
资源主要包括京东商城华为WATCH4数据爬取、数据清洗、可视化以及LDA模型建立进行情感分析,运用者需更改代码里面文件路径为自己的即可
2024-03-26 21:29:11 1.17MB 爬虫 数据可视化分析
1
本项目旨在通过爬取大量的评论数据,分析游客对潍坊和淄博的情感态度,从而为有意向去这两个城市旅游的人提供有价值的参考。通过对评论的情感分析,我们可以解游客对潍坊和淄博的整体评价以及他们在评论中表达的情感倾向。同时,我们还可以获取对这两个城市的客观评价、满意度水平和不满意之处的细节解。这些信息可以帮助旅游从业者、景点管理者和相关决策者更好地了解游客对潍坊和淄博旅游体验的感受,进一步改善景点的服务质量和提升游客的满意度。此外,这些评论数据的情感分析还可以为市场营销活动、旅游推广和舆情管理等方面的决策提供有价值的参考。
2024-03-22 11:53:07 29.59MB 爬虫 情感分析
1
一个爬取微信公众号文章的爬虫
2024-03-20 20:26:10 2.5MB Python开发-Web爬虫
1
适合学习/练手、毕业设计、课程设计、期末/期中/大作业、工程实训、相关项目/竞赛学习等。 项目具有较高的学习借鉴价值,也可直接拿来修改复现。可以在这些基础上学习借鉴进行修改和扩展,实现其它功能。 可放心下载学习借鉴,你会有所收获。 可放心下载学习借鉴,你会有所收获。 可放心下载学习借鉴,你会有所收获。 —— 博主领域:嵌入式领域&人工智能&软件开发。 有任何使用问题欢迎随时与博主沟通(公主呺:阿齐Archie)。 # 注意 1. 本资源仅用于开源学习和技术交流。不可商用等,一切后果由使用者承担。 2. 部分字体以及插图等来自网络,若是侵权请联系删除。
2024-03-05 16:26:06 13.14MB Python Python项目 Python实战
1
本资源中的源码都是经过本地编译过可运行的,下载后按照文档配置好环境就可以运行。资源项目源码系统完整,内容都是经过专业老师审定过的,基本能够满足学习、使用参考需求,如果有需要的话可以放心下载使用。
2024-02-29 21:07:37 42KB 爬虫 网站爬虫 python爬虫
1
python爬取飞猪网站旅游景点数据并保存excel 使用模块: import time # 时间相关 import requests # 请求网页数据 import pandas as pd # 存储数据 from bs4 import BeautifulSoup ¥ 提取网页内容
2024-02-14 19:26:21 3KB python 爬虫
1
淘宝的页面很复杂,如果使用分析ajax或者js的方式,很麻烦 抓取淘宝‘美食’上面的所有食品信息 spider.py #encoding:utf8 import re from selenium import webdriver from selenium.common.exceptions import TimeoutException from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.supp
2024-02-07 00:10:22 56KB
1