python爬虫 | 期末考核课程设计天天基金网数据采集源代码 天天基金网https://fund.eastmoney.com/ 目录 4 一、 爬虫思路分析 5 1. 采集主题 5 2. 采集需求分析 5 3. 采集网站 5 4. 使用到的python第三方库 6 1) 采用的第一种爬虫技术 6 2) 采用的第二种爬虫技术 6 5. 爬虫实现思路分析 6 1) 采用的第一种爬虫技术 7 2) 采用的第二种爬虫技术 9 6. 爬虫实现步骤 11 1) 采用的第一种爬虫技术 11 2) 采用的第二种爬虫技术 15 二、爬虫代码实现 19 1、第一种爬虫技术:动态网页爬取技术、selenium插件使用、源代码及注释 19 2、第二种爬虫技术:逆向分析法、异步加载、源代码及注释 20 三、爬虫运行结果及简要说明 21 1、第一种爬虫技术动态网页爬取技术、selenium插件运行结果及简要说明 21 2、第二种爬虫技术:逆向分析法、异步加载、运行结果及简要说明 23 3、两种爬虫技术运行结果合并 24
2023-04-03 11:00:22 848KB python
1
天天基金爬虫 爬取天天基金网上的所有基金,辅助对基金投资的选择 购买基金前,请务必在官方网站上确认爬取的数据无误! 2021-01-24更新 若存在问题,请切换回Release版本 功能特性 爬取基金的近1、3、6月,近1、3年及成立来的收益率,当前基金经理及其任职时间、任职来的收益率及总的任职时间 模仿tcp的拥塞避免的线程数量控制,慢开始,当出现错误时,线程最大值减半,成功则线程最大值+1 爬取全部数据需要505s,瓶颈为网站的反爬策略 结果展示 2021-01-24 共有10203个基金 食用方法 环境依赖 运行环境Python3.7 依赖见requirements.txt 下载所有.py脚本文件(除MonkeyTest外) 爬取基金数据 运行CrawlingFund.py并等待 筛选基金 还没做 基金分析 也没做 文件结构 -CrawlingFund 爬取主文件,描述整个的
2023-03-02 14:36:54 234KB cralwer fund-crawler Python
1
eastmoney 东方财富、天天基金股票基金证券数据爬虫、数据分析可视化 first of all, 本项目不构成任何投资建议,仅做技术学习用途,投资有风险,入市需谨慎!!! 如有侵权请联系我删除 在线体验,查看 metabase 数据库 账号: 密码: admin123 Usage: git clone https://github.com/minicloudsky/EastMoney.git 创建 python3 虚拟环境 pip3 install virtualenv virtualenv venv source venv/bin/activate 修改数据库,改为你自己的数据库 vim backend/eastmoney/settings.py DATABASES = { "default": { 'ENGINE': 'django.db.backend
2022-04-20 14:29:41 4.9MB JavaScript
1
简介 提到爬虫,大部分人都会想到使用Scrapy工具,但是仅仅停留在会使用的阶段。为了增加对爬虫机制的理解,我们可以手动实现多线程的爬虫过程,同时,引入IP代理池进行基本的反爬操作。 本次使用天天基金网进行爬虫,该网站具有反爬机制,同时数量足够大,多线程效果较为明显。 技术路线 IP代理池 多线程 爬虫与反爬 编写思路 首先,开始分析天天基金网的一些数据。经过抓包分析,可知: ./fundcode_search.js包含所有基金的数据,同时,该地址具有反爬机制,多次访问将会失败的情况。 同时,经过分析可知某只基金的相关信息地址为:fundgz.1234567.com.cn/j
2021-12-05 12:12:10 99KB python python多线程 代理
1
天天基金投顾业务分享-技术.pdf
2021-10-14 13:02:40 766KB 投顾
1
[TOC] 零、版本信息 版本:v1.0.20200424 启动方式:scrapy crawl spider.name 说明:阅读前可以点击原网址查看爬取的目标样式!成功抓取的数据样式在data_temp文件夹内。 本程序从天天基金网采集数据,目前包含下面5个爬虫,基本上涵盖了整个基金市场情况。可以根据实际需要,有选择性的爬取即可。 一、北向资金每日流向 二、北向资金每日前20大交易股 三、基金公司情况 四、基金排名每日涨跌情况 五、大盘(上证指数、深圳成指、创业板指)每日涨跌情况 一、北向资金每日流向 文件名:beixiang.py (上海MarketType=1, 深圳MarketType=3) 字段含义 爬取基本上按照原网址格式,理解起来简单。根据天天基金网提示,值得注意的有两点。1、当日资金流入today_in包含两个部分:已经成交的和已申报未成交的。2、当日净买额today_ne
2021-09-05 20:59:26 1.13MB Python
1
通过本脚本可以获取天天基金里的基金数据,做金融量化,或者对基金感兴趣的可以下载来看看
2021-08-19 09:25:55 864KB 基金数据 Python爬虫 天天基金
1
使用selenium加载网页,回去网页源代码,爬取天天基金网站基金排行,并存储在MongoDB和txt几十本中。
2021-07-12 13:31:46 2KB 爬取天天基金 爬虫 selenium
1
最近基金非常火爆,很多原本不投资、不理财人,也开始讨论、参与买基金了。 根据投资对象的不同,基金分为股票型基金、债券基金、混合型基金、货币基金。 其中股票型基金说白了,就是我们把钱交给基金公司让它们来帮我们买股票,毕竟人家专业些嘛。 所以今天我们就来看看,这些基金公司都喜欢买那些公司的股票。 接下来我们自己动手,从天天基金网获取基金数据来分析,文章末尾可以获得全量代码地址;
2021-06-28 11:04:06 609KB 基金
爬取天天基金数据 获取全量基金信息(基金代码、基金名、类型...) 获取基金指定内单位净值、累计净值、日增长率等 爬取所有基金以及相应的单位净值、累计净值、日增长等
2021-06-28 11:04:06 20KB 天天基金 爬虫