互联网成了海量信息的载体,目前是分析市场趋势、监视竞争对手或者获取销售线索的最佳场所,数据采集以及分析能力已成为驱动业务决策的关键技能。《计算机行业岗位招聘数据分析》旨在利用python编写爬虫程序,从招聘网站上爬取数据,将数据存入到Mysql数据库中,将存入的数据作一定的数据清洗后做数据分析,最后将分析的结果做数据可视化。 爬取招聘网站(智联招聘)上的计算机行业数据,字段为公司招聘链接,公司名称,公司规模,公司性质,职位领域,职位名称,学历要求,职位类别,职位亮点(福利),工资水平,城市,工作经验,简历统计,公司打分,工作地址,职位要求,人员需求,公司业务范围,进行数据清洗及数据维度分析进行数据可视化。 此项目完成之后将大大节约我们查找招聘岗位的时间,它的重大意义是让我们查看工作岗位信息数据进行了数据化、规范化、自动化、可视化管理。它可以帮助我们了解行业的薪资分布、城市岗位分布、岗位要求关键字、岗位经验要求等等一系列的数据。
2023-03-01 11:36:23 3.43MB 分布式 hadoop spark Python爬虫
1
Hadoop hbase hive sqoop集群环境安装配置及使用文档
2023-03-01 11:02:31 133KB 大数据集群 hadoop hbase hive
1
基于云平台Hadoop的中医数据挖掘系统设计与实现.pdf
2023-02-28 21:58:34 1.63MB
1
1、创建一个文本文件main.html,用记事本打开 2、使用table完成布局和表格部分设计,网页宽度设计为1170px; 3、复制文本,使用等标记定义文本格式 4、复制网页链接地址 5、复制网页图片 hadoop.apache.org/releases.html
2023-02-28 18:47:49 36KB 前端 html
1
xxxx: Java HotSpot(TM) 64-Bit Server VM warning: You have loaded library /usr/local/hadoop-2.4.0/lib/native/libhadoop.so which might have disabled stack guard. The VM will try to fix the stack guard now. xxxx: It's highly recommended that you fix the library with 'execstack -c ', or link it with '-z noexecstack'.
2023-02-25 00:09:42 2.41MB hadoop native
1
centos安装配置hadoop Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。
2023-02-23 10:23:21 4.19MB centos hadoop
1
Hadoop和Python的Mapreduce 关于如何使用Python和Hadoop执行MapReduce的一小段回购。 映射器和化简器都是用Python编写的。 有关如何在Hadoop中实现这两个脚本的教程位于。
2023-02-22 17:06:20 1021KB Python
1
hadoop-common-2.7.3-bin-master 包含hadoop.dll、winutils.exe,下载后解压,配置HADOOP_HOME环境变量
2023-02-22 15:43:39 562KB hadoop hadoop-bin-windo winutils
1
Apache Hadoop官方文档,2.7.7版本,离线chm格式。之前我搜遍网络也没找到离线的官方文档,我就自己制作了一份chm格式的,希望对大家有用。
2023-02-21 16:11:48 8.96MB hadoop 官方文档 离线 2.7.7
1
Hadoop权威指南第四版中文版,高清扫描版,有源码 本文带来的资源是hadoop权威指南第四版中文版以及配套的源码,内容以Hadoop2.x为主,包含一些hadoop的stable版本的新特性,与之前 的版本相比增加了介绍YARN , Parquet , Flume, Crunch , Spark的章节适合于Hadoop 初学者。
2023-02-19 09:38:51 190.88MB Hadoop 权威指南 第四版
1