本文来自于cnblogs,文章主要介绍了什么是HDFS,命令行接口,Java接口,数据流,通过Flume和Sqoop导入数据,通过distcp并行复制等相关。学习完Hadoop权威指南有一段时间了,现在再回顾和总结一下HDFS的知识点。HDFS是什么:HDFS即Hadoop分布式文件系统(HadoopDistributedFilesystem),以流式数据访问模式来存储超大文件,运行于商用硬件集群上,是管理网络中跨多台计算机存储的文件系统。HDFS不适合用在:要求低时间延迟数据访问的应用,存储大量的小文件,多用户写入,任意修改文件。HDFS数据块:HDFS上的文件被划分为块大小的多个分块,作为
2021-02-24 14:04:49 293KB HDFS知识点总结
1