19 November 2015

HDFS体系结构

Master-Slave

  • 快速检测应对硬件错误
  • 流式访问数据
  • 转移计算比移动数据本身更划算
  • 简单一致性模型

HDFS的读取流程:

image

image

MapReduce体系结构

  • 分布式编程架构
  • 以数据为中心,看中吞吐率
  • 分而治之
  • Map将一个任务分解成多个子任务
  • Reduce将分解后的任务分别进行处理,并汇总结果为最终结果

体系结构图

Master-Slave

基本概念:

  • 作业
  • 任务
  • 键值对

  • JobTracker
  • TaskTracker

Hadoop的运行模式

单机模式 伪分布式模式 完全分布式模式



blog comments powered by Disqus