java自学网VIP

Java自学网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2677|回复: 0

《深入解析YARN架构设计与实现原理》第1章 环境准备【1.4】

[复制链接]
  • TA的每日心情
    开心
    2021-5-25 00:00
  • 签到天数: 1917 天

    [LV.Master]出神入化

    2025

    主题

    3683

    帖子

    6万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    66153

    宣传达人突出贡献优秀版主荣誉管理论坛元老

    发表于 2017-4-12 20:37:38 | 显示全部楼层 |阅读模式
    1.4 Hadoop源代码组织结构0 }: ?$ i% s) R/ b6 h- U* T
    HadoopJAR压缩包解压后的目录hadoop-{VERSION}中包含了Hadoop全部的管理脚本和JAR包, 下面简单对这些文件或
    $ g& `3 ~5 T' |3 p, y4 V3 Q目录进行介绍。+ F9 c1 Z8 @4 q% H
    ❑binHadoop最基本的管理脚本和使用脚本所在目录, 这些脚本是sbin目录下管理脚本的基础实现, 用户可以直接使用这些) b  I/ W1 K* p0 T& c3 V: L
    脚本管理和使用
    Hadoop
    & b% z2 \+ Z6 d, ?- X( W4 x
    ❑etc Hadoop配置文件所在的目录, 包括core-site.xmlhdfs-site.xmlmapred-site.xml等从Hadoop 1.0继承而来的配置文件和  Z) W0 }5 ~6 C9 q$ c$ \
    yarn-site.xmlHadoop 2.0新增的配置文件。
    0 A1 W, J" b3 A; |) y" }. F
    ❑include : 对外提供的编程库头文件( 具体动态库和静态库在lib目录中) , 这些头文件均是用C++定义的, 通常用于C++" P4 o; v0 D) A( j6 ]# K
    言访问
    HDFS或者编写MapReduce程序。
    8 K" v- p% N9 J# G" {/ x0 O& i, z
    ❑lib : 该目录包含了Hadoop对外提供的编程动态库和静态库, 与include目录中的头文件结合使用。
    - M6 b  P& z+ L1 v
    ❑libexec : 各个服务对应的Shell配置文件所在目录, 可用于配置日志输出目录、 启动参数( 比如JVM参数) 等基本信息。
    - S0 b) I0 ?, q
    ❑sbinHadoop管理脚本所在目录, 主要包含HDFSYARN中各类服务的启动/关闭脚本。
    1 \9 |9 ?" o9 v
    ❑share Hadoop各个模块编译后的JAR包所在目录。9 `5 C/ ~  b8 p6 j% u/ h0 u
    Hadoop 源代码压缩包解压后的目录hadoop-{VERSION}-src中, 可看到如图1-8所示的目录结构, 其中, 比较重要的目录
    3 A- m4 ]5 S" w7 b8 @有:
    hadoop-common-projecthadoop-mapreduce-projecthadoop-hdfs-projecthadoop-yarn-project等, 下面分别介绍这几个目录的作
    4 N# a% }: d: B' q! {用。8 T% d) i# h1 z$ Q% P" D
    ❑hadoop-common-projectHadoop基础库所在目录, 该目录中包含了其他所有模块可能会用到的基础库, 包括RPC: E/ M& H6 p+ P" q. z  {
    MetricsCounter等。
    0 W" w, }' u! M, ?2 K: h( _8 g
    1-8 Hadoop安装目录结构
    7 z, ~9 J6 q4 n4 b
    ❑hadoop-mapreduce-projectMapReduce框架的实现, 在MRv1中, MapReduce由编程模型( map/reduce) 、 调度系统
    4 @) g+ b8 s2 n- b) L
    JobTrackerTaskTracker) 和数据处理引擎( MapTaskReduceTask) 等模块组成, 而此处的MapReduce则不同于MRv1中的实. Z! g' l3 m4 e$ R: i
    现, 它的资源调度功能由新增的
    YARN完成( 编程模型和数据处理引擎不变) , 自身仅包含非常简单的任务分配功能。6 v% `# ~, \* W/ G  {
    ❑hadoop-hdfs-projectHadoop分布式文件系统实现, 不同于Hadoop 1.0中单NameNode实现, Hadoop 2.0支持多NameNode
    & _: u2 t  g! Q+ D; Z- H. _1 T同时解决了
    NameNode单点故障问题。# ?  J9 e. G/ A- Z$ q2 f7 R0 _! w
    ❑hadoop-yarn-projectHadoop资源管理系统YARN实现。 这是Hadoop 2.0新引入的分支, 该系统能够统一管理系统中的资- A+ l1 A9 q/ W( l' _! O1 C
    源, 并按照一定的策略分配给各个应用程序, 本书将重点剖析
    YARN的实现。
    6 x; _. l+ @! E) ~* v* p本书重点介绍
    YARN的实现原理, 下面就对Hadoop YARN源代 码组织结构 [3] 进行介绍。 YARN目录组织结构如图1-9所示。
    * F* F  J. T4 J总体上看,
    Hadoop YARN分为5部分: APICommonApplicationsClientServer, 它们的内容具体如下:6 I" t& O8 p" T
    ❑YARN APIhadoop-yarn-api目录) : 给出了YARN内部涉及的4个主要RPC协议的Java 声明和Protocol Buffers定义, 这4# I0 p0 E) q) b: ^
    RPC协议分别是ApplicationClientProtocolApplicationMasterProtocolContainerManagementProtocol
    , Q" y  z) l' @( c) R* K- y3 X3 t+ ^3 w
    ResourceManagerAdministrationProtocol, 本书将在第2章对这部分内容进行详细介绍。0 O: H+ f  D8 ^, J2 V+ X; |
    ❑YARN Commonhadoop-yarn-common目录) : 该部分包含了YARN底层库实现, 包括事件库、 服务库、 状态机库、 Web2 [; J( P/ O! S$ V. c
    面库等, 本书将在第
    3章对这部分内容进行详细介绍。3 k6 X6 h- Z0 M/ x  ~! ]$ f
    ❑YARN Applicationshadoop-yarn-applications目录) : 该部分包含了两个Application编程实例, 分别是distributedshell. V/ t' _' X' q3 B
    Unmanaged AM, 本书将在第4章对这部分内容进行详细介绍。
    & u7 D' z  V9 q: d6 m4 F! y' E
    ❑YARN Clienthadoop-yarn-client目录) : 该部分封装了几个与YARN RPC协议交互相关的库, 方便用户开发应用程序, 本
    ; C1 Y- k7 \/ w. `2 x书将在第
    4章对这部分内容进行详细介绍。( u) d0 P2 I. U2 ~/ p
    ❑YARN Serverhadoop-yarn-server目录) : 该部分给出了YARN的核心实现, 包括ResourceManagerNodeManager、 资源管; r( K8 }& _7 w* I0 X' P6 \
    理器等核心组件的实现, 本书将在第
    5~7章对这部分内容进行详细介绍。
    ; y1 w- P; f8 s+ Y; O. q
    1-9 Hadoop YARN目录组织结构. c6 V2 ]) l; ?6 t8 Y  o, ]
    [3] 不同Hadoop版本的源代码组织结构有较大差别, 本书的分析是基于Hadoop 1.0.0的。  0 Z# G, Y" B8 S

    - ^5 X$ |" ~* N; q3 F8 B4 \. a9 `2 L. v7 P. h& }  O
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|手机版|小黑屋|Java自学网

    GMT+8, 2024-6-17 11:18 , Processed in 0.108512 second(s), 31 queries .

    Powered by Javazx

    Copyright © 2012-2022, Javazx Cloud.

    快速回复 返回顶部 返回列表