大数据与分布式计算.pptx

上传者: 43934844 | 上传时间: 2022-06-21 17:05:52 | 文件大小: 4.2MB | 文件类型: PPTX
大数据与分布式计算 大数据与分布式计算全文共64页,当前为第1页。 HDFS Hadoop Distributed File System 大数据与分布式计算全文共64页,当前为第2页。 1990年,一个普通的硬盘驱动器可存储1370 MB的数据并拥有4.4 MB/s的传输速度 ,所以,只需五分钟的时间就可以读取整个磁盘的数据。 20年过去了,1 TB级别的磁盘驱动器是很正常的,但是数据传输的速度却在100 MB/s左右。所以它需要花两个半小时以上的时间读取整个驱动器的数据。 从一个驱动器上读取所有的数据需要很长的时间,写甚至更慢。 如何解决? 磁盘损坏数据丢失怎么办? 如果需要存储计算1000T数据怎么办? 大数据与分布式计算全文共64页,当前为第3页。 常用RAID技术 大数据与分布式计算全文共64页,当前为第4页。 RAID类型 访问速度 数据可靠性 磁盘利用率 RAID0 很快 很低 100% RAID1 很慢 很高 50% RAID10 中等 很高 50% RAID5 较快 较高 (N-1)/N RAID6 较快 较(RAID5)高 (N-2)/N 大数据与分布式计算全文共6

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明