Hadoop学习笔记——NameNode 和 DataNode 以及容错处理 - Spark Note Book - ITeye博客

`

spark_li

浏览: 19869 次
性别:
来自: 杭州

最近访客更多访客>>

jinhailion

nero108

ZhangRuiQ

霹雳小智哥

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

spark_li： wantodare 写道对于这句引用3. 当客户端收到全部写入 ...
Hadoop学习笔记——Hadoop 读写文件过程剖析
wantodare：对于这句引用3. 当客户端收到全部写入成功的回执（ack pa ...
Hadoop学习笔记——Hadoop 读写文件过程剖析

Hadoop学习笔记——NameNode 和 DataNode 以及容错处理

博客分类：

Hadoop

阅读更多

概念：
HDFS会把一个很大的文件分块（与传统的文件系统类似），存放在不同的DataNode上。不过这个块是个逻辑概念，比较大，默认是64M。
Hadoop以“管理者-工作者”模式运行。NameNode就是管理者，它保存了文件系统中所有文件以及目录信息。也记录了每个文件的分块信息。但这些分块具体在哪些机器上存储则由DataNode自己上报。

容错:
NameNode的容错：
所有的文件访问都要通过NameNode来进行，所以NameNode至关重要。一旦NameNode发生毁坏，则整个系统都不可用。HDFS提供了两种容错机制来保证NameNode的可用性：
1 第一种方法是把文件元数据写入NFS，备份在另一台机器上。备份操作是同步的，原子的。
2 第二种方法是运行辅助的NameNode，不过这个NameNode并不提供服务，它只是把操作日志Merge到Metadata中，但是如果主NameNode失效，总是有一部分数据来不及Merge，会造成数据丢失。所以一般的做法还是把NFS中备份的数据拷贝到这个NameNode，并作为主NameNode运行。

DataNode容错：
DataNode以数据块作为容错单位，通常一个数据块会被复制到三个DataNode上去。一旦某个数据块访问失效，则去其他备份的机器上去读取。并且会把这个数据块再进行一次复制，以达到备份标准。
也就是说，DataNode不是在机器级别上进行备份，而是在数据块级别上进行备份，这样就大大节省了机器数量。

分享到：

Hadoop学习笔记——Hadoop 读写文件过程剖 ... | Hadoop学习笔记——哪些场景适用，哪些不适 ...

2013-04-19 15:00
浏览 2316
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop2.0 2个namenode 2个datanode 部署: 1. Hadoop 2.0 2. 部署在2个Ubuntu上 3. 2个namenode 2个datanode

Hadoop高级编程——构建与实现大数据解决方案: 《Hadoop高级编程——构建与实现大数据解决方案》本书关注用于构建先进的、基于Hadoop的企业级应用的架构和方案，并为实现现实的解决方案提供深入的、代码级的讲解。本书还会带你领略数据设计以及数据设计如何影响...

Hadoop高级编程——构建与实现大数据解决方案.rar: Hadoop高级编程——构建与实现大数据解决方案.rar

Hadoop学习笔记: Hadoop学习笔记，自己总结的一些Hadoop学习笔记，比较简单。

Hadoop 学习笔记.md: Hadoop 学习笔记.md

3.Hadoop学习笔记.pdf: hadoop学习笔记，hadoop简介，适用于hadoop入门，讲解hadoop安装，使用，基本原理，大数据，分布式等概念

最新Hadoop学习笔记: hadoop 学习笔记，从搭建环境开始到具体实验。包括hdfs配置，yarn配置，分布式配置，如何编写mapreuduce 一步一步手把手，最后项目是hadoop 与 javaweb

hadoop双机热备——facebook hadoop HA的资料整理: hadoop双机热备——facebook hadoop HA的资料整理，流汗整理

Hadoop快速入门——第四章、zookeeper安装包: Hadoop快速入门——第四章、zookeeper安装包

【大数据】Hadoop常用启动命令.pdf: TaskTrack start-dfs.sh 启动Hadoop HDFS守护进程NameNode、SecondaryNameNode和DataNode stop-dfs.sh 停⽌Hadoop HDFS守护进程NameNode、SecondaryNameNode和DataNode hadoop-daemons.sh start namenode 单独启动...

hadoop实战——初级部分学习笔记 2: hadoop实战——初级部分学习笔记 2

大数据技术课程设计.docx: 任务一：完成Hadoop集群部署前环境的准备工作 1.1 虚拟机环境准备 1. 安装虚拟机 2. 克隆虚拟机 3. 修改网络配置 4. 修改主机名和映射 5. 关闭防火墙 1.2 安装JDK 1.3 安装Hadoop 1.4 集群配置 1. 编写集群分发脚本...

hadoop学习笔记: 我学习hadoop的笔记，并在公司做的报告，给大家共享下

云计算hadoop学习笔记: 云计算，hadoop，学习笔记， dd

hadoop学习笔记.rar: hadoop学习笔记.rarhadoop学习笔记.rarhadoop学习笔记.rarhadoop学习笔记.rarhadoop学习笔记.rarhadoop学习笔记.rarhadoop学习笔记.rar

Hadoop学习笔记整理: Hadoop学习笔记

hadoop常见问题及解决办法: 在网上搜集的以及本人自己总结的hadoop集群常见问题及解决办法，融合了网上常常搜到的一些文档以及个人自己的经验。

Global site tag (gtag.js) - Google Analytics