LemonHouse 深圳市新房数据分析工具 by cheyo 依赖包 Python 2.6 BeautifulSoup Django django_pagination 软件结构 Django项目 Spider程序 安装步骤 下文以安装在/usr/app/house目录为例. 下载代码到/usr/app/house目录下,形成如下目录结构: [root@cheyo house]# pwd /usr/app/house [root@cheyo house]# l total 16 drwxr-xr-x 7 root root 4096 Mar 8 21:35 DjangoHome drwxr-xr-x 5 root root 4096 Mar 8 21:34 ENV drwxr-xr-x 3 root root 4096 Mar 8 21:35 spider drwxr-xr-x 2
2023-03-01 13:47:35 735KB Python
1
互联网成了海量信息的载体,目前是分析市场趋势、监视竞争对手或者获取销售线索的最佳场所,数据采集以及分析能力已成为驱动业务决策的关键技能。《计算机行业岗位招聘数据分析》旨在利用python编写爬虫程序,从招聘网站上爬取数据,将数据存入到Mysql数据库中,将存入的数据作一定的数据清洗后做数据分析,最后将分析的结果做数据可视化。 爬取招聘网站(智联招聘)上的计算机行业数据,字段为公司招聘链接,公司名称,公司规模,公司性质,职位领域,职位名称,学历要求,职位类别,职位亮点(福利),工资水平,城市,工作经验,简历统计,公司打分,工作地址,职位要求,人员需求,公司业务范围,进行数据清洗及数据维度分析进行数据可视化。 此项目完成之后将大大节约我们查找招聘岗位的时间,它的重大意义是让我们查看工作岗位信息数据进行了数据化、规范化、自动化、可视化管理。它可以帮助我们了解行业的薪资分布、城市岗位分布、岗位要求关键字、岗位经验要求等等一系列的数据。
2023-03-01 11:36:23 3.43MB 分布式 hadoop spark Python爬虫
1
如今的大数据技术应用场景,对实时性的要求已经越来越高。作为新一代大数据流处理框架,由于非常好的实时性,Flink独树一帜,在近些年引起了业内极大的兴趣和关注。Flink能够提供毫秒级别的延迟,同时保证了数据处理的低延迟、高吞吐和结果的正确性,还提供了丰富的时间类型和窗口计算、Exactly-once 语义支持,另外还可以进行状态管理,并提供了CEP(复杂事件处理)的支持。Flink在实时分析领域的优势,使得越来越多的公司开始将实时项目向Flink迁移,其社区也在快速发展壮大。目前,Flink已经成为各大公司实时领域的发力重点,特别是国内以阿里为代表的一众大厂,都在全力投入,不少公司为Flink社区贡献了大量源码。如今Flink已被很多人认为是大数据实时处理的方向和未来,很多公司也都在招聘和储备了解掌握Flink的人才。本教程将Flink理论与电商数据分析项目实战并重,对Flink基础理论知识做了系统的梳理和阐述,并通过电商用户行为分析的具体项目用多个指标进行了实战演练。为有志于增加大数据项目经验、扩展流式处理框架知识的工程师提供了学习方式。二、教程内容和目标本教程主要分为两部分:第一部
1
在R上使用Facebook进行分析 使用R编程语言通过Graph API对从Facebook获得的社交数据进行数据分析和自然语言处理。 该项目根据人的社交活动以及语言或单词使用情况绘制图表。 还进行了基于极性和情感的情感分析,并绘制了图表。
2023-02-28 11:29:11 6KB R
1
Python数据分析与机器学习-使用Kmeans进行图像压缩 Python数据分析与机器学习-使用Kmeans进行图像压缩
2023-02-27 22:18:35 16KB python
1
孔穴效应模型 当变异函数r(h)在h大于一定的距离后, 并非单调递增,而是具有一定周期波动,这时就显示出孔穴效应.在有基台值与无基台值模型中,均能出现孔穴效应. 孔穴效应属于线性非平稳统计范畴.
2023-02-27 16:54:29 2.33MB 空间数据
1
运营数据对比 A.注册用户数对比或者增长曲线图 B.活跃用户数或者活跃用户增长曲线图 C.消费情况或者消费分布图 D.用户在线时间分布图 E.其他数据对比 相关事件描述 A.社会环境事件:如放假、双11活动等 B.竞争对手事件:同类产品上线或者活动 C.推广事件:如广告投放、活动举办(雪莹做) D.店铺事件:店铺装修等(陈俊宇做) E.其他事件 阶段运营分析 A.导致数据变化的原因或者潜在可能 B.导致市场反馈信息的原因或潜在可能 信息系统管理 1.信息分类 A.可靠数据:用户注册数据、用户活跃数据、用户消费数据、用户收藏数据、广告监控 数据、产品活动数据等 B.推测数据:竞争对手数据、用户群体分布/软宣传效果数据、市场活动效果数据等 2.信息来源渠道 A.网站后台 C.媒体咨询 D.网站论坛 F.客服反馈(赵效宇做) G.行业交流(雪莹做) 主要工作(左娜) 后台功能开发需求和新增需求 外部咨询或者调查报告的采购 组织执行相关调查统计 提出相关资料或者信息收集的方案 信息分类和分析 ----------------------- 淘宝店数据分析报告模板全文共1页,当前为第1页。
2023-02-27 16:49:27 27KB 文档资料
1
1、每日微信群内分享5+最新重磅报告 2、每日分享当日华尔街日报、金融时报 3、每周分享经济学人 4、每月汇总500+份当月重磅报告
2023-02-27 16:43:27 1.74MB 地产 旅游 家居 酒店
1
盒马生鲜新零售数据分析完整版.pptx
1
使用python的requests配合re对微博评论进行获取存储在mysql数据库中 使用pandas库对数据进行分析处理 使用snownlp对文本进行分析 使用echarts.js将分析的数据进行可视化呈现 总体框架使用python 的Django框架
2023-02-24 16:36:53 628KB 爬虫 数据可视化 数据分析 情感分析
1