李玉坤

个人博客

[Hadoop] 分布式文件系统HDFS 二

HDFS环境搭建、常见问题(小文件问题、Namenode内存管理、数据迁移、数据平衡)、数据压缩、纠删码

HDFS环境搭建官网安装文档Hadoop伪分布式安装步骤http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html 下载Hadoop http://archive.cloudera.com/cdh5/cdh/5/ 2.6.0-cdh5.7.0 或则 wge......

[Hadoop] 分布式文件系统HDFS 一

HDFS概述及设计目,什么是HDFS、HDFS前提和设计目标(HDFS 构成及工作原理解析,基本构成)、数据读写过程、集群架构(datanode、namenode、SecondaryNamenode)、HDFS HA简介、HDFS文件类型、HDFS副本机制

HDFS概述及设计目标如果让我们自己来设计一个分布式文件系统,咋办?下图是普通分布式文件系统 什么是HDFS Hadoop实现了一个分布式文件系统( Hadoop Distributed File System) ,简称HDFS 源自Google的GFS论文 发表于2003年,HDFS是GFS的克隆版 基于JAVA实现的一个分布式文件系统 基于unix/linux 是Hadoop最重要的核心......