只为小站
首页
域名查询
文件下载
登录
java8 api 全 英文 chm版
java8的API,很全的;官方下的html版的,转成了chm版,方便使用
2025-10-02 09:27:08
59.67MB
java8
1
大数据分析实验报告(
全英文
)
本资源为燕山大学大数据实验报告,包括四个实验hadoop和spark下载,使用mllib实现线性回归算法,使用mllib实现支持向量机算法,使用mllib实现支持k-means算法。其中支持向量机算法求解了recall,precision,f1-score和accracy来实现算法评估。 ### 大数据分析实验报告知识点概览 #### 实验一:Hadoop与Spark环境构建及应用开发 ##### 实验目的与要求 本实验旨在使学生掌握Hadoop与Spark环境的搭建方法,并能正确启动Spark服务流程,进而实现Spark应用程序并确保其正常运行。 1. **Hadoop与Spark环境构建**: - 要求学生能够独立完成Hadoop与Spark环境的安装配置。 - 学生需具备启动Hadoop与Spark服务的能力。 2. **Spark应用开发**: - 学生应能够编写并运行简单的Spark应用程序。 - 通过实践加深对Spark工作原理的理解。 ##### 实验环境与软件配置 - **虚拟机平台**:VMware Workstation Pro 16 - **操作系统**:Ubuntu 14.04 Server (AMD64) - **JDK版本**:1.8 - **Scala版本**:2.12.6 - **Hadoop版本**:2.7.7 - **Spark版本**:2.4.4 (含Hadoop 2.7) ##### 实验内容 - 在Linux系统或虚拟机上安装配置Hadoop与Spark环境,并启动相应的守护进程。 - 使用Spark实现WordCount程序的开发与运行。 1. **数据准备**: - 输入数据:`input.txt` 2. **代码实现**: ```scala import org.apache.spark.SparkConf import org.apache.spark.SparkContext import org.apache.log4j.{Level, Logger} object WordCount { def main(args: Array[String]): Unit = { Logger.getLogger("org").setLevel(Level.OFF) val conf = new SparkConf().setAppName("WordCount").setMaster("local[*]") val sc = new SparkContext(conf) val input = sc.textFile("file:/home/liqing/桌面/input.txt") val words = input.flatMap(line => line.split(" ")) val wordCounts = words.map(word => (word, 1)).reduceByKey(_ + _) val result = wordCounts.collect() result.foreach(println) sc.stop() } } ``` 3. **测试结果**: - 访问Hadoop集群管理界面:`192.168.37.146:50070` - 访问Spark UI:`192.168.37.146:8080` - WordCount程序运行结果展示。 由于WordCount程序不涉及分类或回归任务,因此无法用Precision、Recall等指标进行评估。 #### 实验二:使用Spark MLlib实现线性回归算法 ##### 实验目的与要求 1. **理解线性回归的基本原理**:要求学生能够准确理解线性回归算法的基本原理。 2. **实现线性回归算法**:要求学生能够利用Spark MLlib实现基本的线性回归算法,并进行实际数据集上的训练与测试。 ##### 实验内容 1. **数据准备**:准备用于训练和测试的样本数据集。 2. **模型训练**:利用Spark MLlib提供的API实现线性回归模型训练过程。 3. **模型评估**:使用测试集数据对训练好的模型进行评估,计算准确率、精确率、召回率以及F1分数等指标。 本实验报告通过Hadoop与Spark环境的构建、WordCount程序的实现,以及基于Spark MLlib的线性回归算法的实现与评估,全面涵盖了大数据处理与分析的核心技术要点。学生在完成这些实验后,将对Hadoop、Spark及其机器学习库有更深入的认识与理解。
2025-04-18 23:57:50
762KB
hadoop
数据分析
1
ISO26262-1 最
全英文
版
无删减
2023-08-26 12:01:15
784KB
ISO26262-1
1
PCI Express ® Revision 3.0 + Revision 2.1 +Revision 1.1 三版本
全英文
.zip
压缩包内含以下文件: 1.PCI Express ® Base Specification Revision 2.1 _2009_.pdf 2.PCI Express ® Base Specification Revision 3.0 _2009_DRAFT对比版.pdf 3.PCI Express ® Base Specification Revision 3.0 _2010_正式版.pdf 4.PCI Express ® Base Specification Revision 1.1 _2005_.pdf
2023-04-14 10:02:42
13.01MB
PCIe
PCI
Expres
协议
1
<<计算机视觉:算法与应用第二版>>
全英文
版
<<计算机视觉:算法与应用第二版>>
全英文
版
2022-12-13 13:25:56
41.19MB
计算机视觉
1
TCP IP Illustrated, Volume 1,2,3 网络底层协议-
全英文
资料
TCP IP Illustrated, Volume 1,2,3 网络底层协议-
全英文
资料(全) 1,TCP-IP Illustrated, Volume 1_The Protocols 2,TCP IP Illustrated, Volume 2_ The implementation 3,TCP IP Illustrated, Volume 3_ for Transactions
2022-10-16 09:04:48
67.63MB
TCP-IP
全英文资料
1
TCP IP Illustrated, Volume 2- The implementation
TCP IP Illustrated, Volume 2_ The implementation 网络底层协议-
全英文
资料
2022-10-15 13:03:29
36.17MB
TCP-IP
全英文资料
1
TCP-IP Illustrated Volunme 1-2(全)
1,TCP-IP Illustrated Volunme 1-The Protocols 2,TCP IP Illustrated, Volume 2_ The implementation 网络底层协议-
全英文
资料。
2022-10-15 13:03:28
30.47MB
TCP-IP
全英文资料
1
解决并分析问题~英语PPT
工程英语PPT 解决并分析问题类型的
全英文
介绍 简约大气 内容丰富
2022-07-01 18:03:53
1.72MB
工程英语
英语PPT
全英文
Adobe Premiere
全英文
使用教程
Adobe Premiere
全英文
教程
2022-06-17 09:09:15
69.04MB
premiere
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
ChinaMeteorologicalDataHandler.R
avantage 软件 xps 处理软件30天后不能使用问题
Python+OpenCV实现行人检测(含配置说明)
随机森林用于分类matlab代码
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
vivado 破解 lisence(有效期到2037年) 下载
商用密码应用与安全性评估——霍炜.pdf
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
多目标微粒子群算法MOPSO MATLAB代码
YOLOv5 人脸口罩图片数据集
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
大唐杯资料+题库(移动通信)
token登录器.rar
EasyMedia-ui.zip
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
最新下载
自动机与自动线.李绍炎
谭浩强《c语言程序设计》第三版pdf(含目录)
3D slicer Windows版下载Slicer-4.11.20200930-win-amd64.exe
opera for wince 5.0
[英文游戏编程图书全集]The.Animator.Survival.Kit
CICflowmeter安装文件以及详细说明教程(至2020.9.20可成功运行)
基于matlab点云工具箱对点云进行处理二:对点云进行欧式聚类,获得聚类后点云簇的外接矩形.rar
MS1824 Datasheet-EN(1)-已解锁.pdf
ad9253器件基于FPGA编写的Verilog驱动程序 该程序参考Xilinx官方手册xapp524来编写实现 已通过代码仿真验证,可直接移植到项目中
windows内核安全与驱动开发(pdf+源码).zip
其他资源
长江支流——长江流域范围——矢量边界支流名称.zip
激光打标机驱动及软件 金橙子
车辆线性二自由度模型 Simulink
ARCGIS二次开发课程设计
STM32使用FIR滤波器的详细过程
数据库复习资料.rar
一种改进的DV-HOP算法matlab仿真代码
luke-7.1.0
高通9x07 软件架构及用户指导 mdm9x07_linux_enablement_software_user_manual
最佳教育后端:APIдлясервисов最佳教育-源码
React本机时间选择器-源码
M45517.lck
netacad克隆具有codeigniter的网站-源码
EUV光刻技术-经济高效且适合大规模生产的工艺,晶圆被暴露于波长为13.5纳米的超紫外线(EUV)。通过这种方式,提高了芯片制造商的生产效率和利润。.mp4
MQTT协议及其在物联网中的应用
axure部件库 web 移动端
车辆系统动力学 - 第二篇纵向动力学.ppt
Flappy Bird 试验版
vb+access客户管理系统全套
emmc5.1标准兼容5.0 、ESD84-B51.pdf
采用基于区域的种子区域生长方法(SRG)的彩色图像分割
selenium-java-2.44.0.jar包
omp算法(matlab)稀疏表示中用来求最优解
单片机max232电路图