李玉坤
个人博客
Toggle navigation
李玉坤
Home
About
Archives
Tags
[Hadoop] 分布式文件系统HDFS 二
HDFS环境搭建、常见问题(小文件问题、Namenode内存管理、数据迁移、数据平衡)、数据压缩、纠删码
HDFS环境搭建官网安装文档Hadoop伪分布式安装步骤http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html 下载Hadoop http://archive.cloudera.com/cdh5/cdh/5/ 2.6.0-cdh5.7.0 或则 wge......
Posted by 李玉坤 on 2017-05-31
HDFS
[Hadoop] 分布式文件系统HDFS 一
HDFS概述及设计目,什么是HDFS、HDFS前提和设计目标(HDFS 构成及工作原理解析,基本构成)、数据读写过程、集群架构(datanode、namenode、SecondaryNamenode)、HDFS HA简介、HDFS文件类型、HDFS副本机制
HDFS概述及设计目标如果让我们自己来设计一个分布式文件系统,咋办?下图是普通分布式文件系统 什么是HDFS Hadoop实现了一个分布式文件系统( Hadoop Distributed File System) ,简称HDFS 源自Google的GFS论文 发表于2003年,HDFS是GFS的克隆版 基于JAVA实现的一个分布式文件系统 基于unix/linux 是Hadoop最重要的核心......
Posted by 李玉坤 on 2017-05-23
HDFS
← Newer Posts
FEATURED TAGS
大数据
computer language
面试题
SpringBoot
Kafka
ZooKeeper
HBase
Phoenix
HDFS
Hadoop
MapReduce
YARN
Hive
数据仓库
Kerberos
Kettle
Linux
Scala
Spark
数据平台
Ranger
Azkaban
Presto
Hue
Java
Json
ABOUT ME
Stay hungry,Stay foolish
RECENT POSTS
[Linux]07 linux下NFS远程目录挂载
[数据平台]08 数据平台之SQL查询引擎
[Spark] 遇到的Spark问题
全方位测评Hive、SparkSQL、Presto等七个大数据查询引擎
[Spark] Spark入门
ARCHIVES
July 2018
7
June 2018
7
May 2018
7
April 2018
6
March 2018
7
February 2018
7
January 2018
7
December 2017
5
November 2017
6
October 2017
9
September 2017
6
August 2017
6
July 2017
5
June 2017
5
May 2017
2