java自学网VIP

Java自学网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 4093|回复: 1

【java电子书】Spark大数据处理:技术、应用与性能优化 PDF 电子书 百度云 百度网...

[复制链接]
  • TA的每日心情
    开心
    2021-5-25 00:00
  • 签到天数: 1917 天

    [LV.Master]出神入化

    2025

    主题

    3683

    帖子

    6万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    66151

    宣传达人突出贡献优秀版主荣誉管理论坛元老

    发表于 2016-12-7 12:30:43 | 显示全部楼层 |阅读模式
    java自学网(www.javazx.com)-java论坛,java电子书推荐:《Spark大数据处理:技术、应用与性能优化》
    * i4 o# ^) X- L/ Njava电子书推荐理由:这是一本依据最新技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。
    * b1 A1 |$ e' j0 r0 C3 Z/ c, Q6 {7 I, h, U4 U; K* n
    ! \1 K4 V. u9 _2 r2 c8 W* k
    作者:高彦杰 著
    - ^0 X; d& n4 Z; g$ r! o" a出版社:机械工业出版社
    / s* @, ]+ x# a% X7 v$ L2 S出版时间:2014年11月 4 k  a" p! L/ t7 ^) N5 p; s& `) P

    ( S0 U( e, g" p- B1 y) Z
    3 E9 X$ l. C) G* Q- G; h
    QQ截图20161207122021.jpg
    ; ]! F1 f3 W( e' _6 \* n0 E7 a! s' b/ [. l/ J

    1 y  s6 K0 A3 k- R7 S4 Hjava电子书目录:
    ) l/ ?% D" R$ L% ~
    7 g/ @5 k4 `' h" i

    $ [& u5 i, H+ _第1章 Spark简介0 Y# h0 y; E/ t- F: U3 \8 W9 N
    1.1 Spark是什么: u2 t9 \' z% F* g5 \2 r8 T
    1.2 Spark生态系统1 D/ P9 y9 m, r* f" s* h$ F
    1.3 Spark架构, S) X) I9 T: Z! Y
    1.4 Spark分布式架构与单机多核架构的异同
    2 U0 z& }7 x$ d0 ~1.5 Spark的企业级应用" b; u, `! V: y1 P8 h) A& O4 Y
    1.5.1 Spark在Amazon中的应用
    9 o0 ?% M  Q) z4 f' }1.5.2 Spark在Yahoo!的应用
    3 p1 U. w, t; M% I1.5.3 Spark在西班牙电信的应用
    $ n5 w4 [7 K& X, ~* H; k) p$ n1.5.4 Spark在淘宝的应用+ Z. ^$ U- ~% Q6 N  W3 Q
    1.6 本章小结8 N$ o$ r* @/ w
    第2章 Spark集群的安装与部署
      J  e# m8 {2 O7 f2.1 Spark的安装与部署$ r  j  p* ^9 D* F
    2.1.1 在Linux集群上安装与配?4 H( G/ {4 X( Z
    2.1.2 在Windows上安装与配?
    - a1 f9 D2 o7 B. a4 X2.2 Spark集群初试
    : e( j% W3 C0 s6 v: T. }2.3 本章小结- y4 Y8 Y4 B/ t& N
    第3章 Spark计算模型9 @! x0 J3 f3 J: t1 V: R
    3.1 Spark程序模型
    + V" V& J1 B" `* H. c  _3.2 弹性分布式数据集4 _! t2 a3 S+ Y
    3.2.1 RDD简介/ l6 i/ v" e$ ~. |0 Y' t4 [
    3.2.2 RDD与分布式共享内存的异同
    8 y: R0 D$ p! s: y3.2.3 Spark的数据存储
    * I) E* D  u, ~# k2 _8 c5 p3.3 Spark算子分类及功能
    9 h( X3 E/ K6 k* `3.3.1 Value型Transformation算子" p1 x, N3 F; d
    3.3.2 Key-Value型Transformation算子7 I5 ~/ y( A) W& F# f
    3.3.3 Actions算子
    7 p2 _( a) x/ p& d3.4 本章小结
    . t) Y. _7 ^, u0 `第4章 Spark工作机制详解
    6 O. B* V8 Y- K: _& f2 x4.1 Spark应用执行机制
    # h, E! H' Y  S: r2 h4.1.1 Spark执行机制总览) g0 e/ @, m. Z; U# N- @9 v
    4.1.2 Spark应用的概念2 Q& f, l8 R9 g0 r" Q0 K
    4.1.3 应用提交与执行方式
    ! a, [9 R3 e6 g4.2 Spark调度与任务分配模块1 m& k2 F, e/ s3 |1 j
    4.2.1 Spark应用程序之间的调度6 S3 z4 l1 F' z: j- }
    4.2.2 Spark应用程序内Job的调度" z" t% ~9 J$ d: S! M$ y) _3 f
    4.2.3 Stage和TaskSetManager调度方式- i- U4 w6 o8 F2 [9 f6 k
    4.2.4 Task调度
    5 s+ Z1 B$ O# T2 a, S' N+ U/ |+ j9 ~4.3 Spark I/O机制2 i/ [: {! B4 g
    4.3.1 序列化
    ) |) _  p0 f. I+ L4.3.2 压缩
    4 z8 s* t+ d2 f: C6 V7 b6 C$ V4.3.3 Spark块管理  }2 B) B9 [: }" X, S; i6 C7 d
    4.4 Spark通信模块
    & ?. a. A4 D* V7 W4.4.1 通信框架
    4 V  X  R8 g) m1 I% N7 R8 |4.4.2 Client、Master和Worker间的通信/ K( M9 E( }0 m3 s4 m( p/ `
    4.5 容错机制
    % z8 C" F8 O0 b9 p2 x4.5.1 Lineage机制
    , X$ b% u. r+ p" r% L4.5.2 Checkpoint机制, O$ W$ O; b' v6 Y* r& I
    4.6 Shuffle机制; |9 M0 Q! p" Q! x+ b" v) L
    4.7 本章小结
    7 z& r. u  V+ l. Q7 d  t! C: |第5章 Spark开发环境配置及流程
    " R3 x( l0 H* D: |: \! D5.1 Spark应用开发环境配置
    % t1 D4 ^5 L& l  l# }5 g6 ^3 W5.1.1 使用Intellij开发Spark程序/ ^" g$ h% k, [
    5.1.2 使用Eclipse开发Spark程序: D: Z, @. N8 k( _
    5.1.3 使用SBT构建Spark程序. U: u* X! K. }1 }+ R# M9 h
    5.1.4 使用Spark Shell开发运行Spark程序2 v& l+ W+ S* C4 d/ R( Z
    5.2 远程调试Spark程序
    8 D# T, h$ F. p0 x" }% w+ Q) S5.3 Spark编译2 @6 ?2 Q0 x0 n6 l  e& V
    5.4 配置Spark源码阅读环境3 }# \$ F) n8 \3 p$ ^
    5.5 本章小结
    7 D0 {) \" L, Q第6章 Spark编程实战
    $ f% v/ {6 J+ R5 ^6.1 Word
      F' R" e: e2 V" {! V" y) s- x6.2 8 j, Z$ l: S; d, w; p0 R
    6.3 中位数
    3 V' x8 `7 v1 L3 A" a/ W9 e% x% B6.4 倒排索引
    / w# D* c1 E# `* {( s$ Q6.5 Coun9 ]) p/ g5 {& T' I5 [
    6.6 倾斜连接1 s* A( \) Z( T
    6.7 股票趋势预测
    3 W: F! E: i5 M. [6.8 本章小结& o& U3 Y. o* T) Y9 s
    第7章 Benchmark使用详解) Z* O) n# B, `
    7.1 Benchmark简介
    , k% }% r3 i( J* P7.1.1 Intel Hibench与Berkeley BigData0 c9 ?! H* }3 s' g, i/ E7 T3 ~, S& a
    7.1.2 Hadoop Gr  I2 T, I3 G/ l5 E* J- F
    7.1.3 Bigbench、BigDataBenchmark与T6 p. W8 J, I2 V  _4 v% l
    7.1.4 其他Benc
    7 t# _) n; k' a% X+ I/ F7.2 Benchmark的组成
    ; s" o, G) v7 b) a) r8 |7 _' c7.2.1 数据集) ?' a! \: @( {: o
    7.2.2 工作负载/ n) p3 O( @- J0 m- a9 n
    7.2.3 度量指标
    % n$ ?( f3 Z/ D: [% s7.3 Benchmark的使用9 Q, x% J6 I* A4 y3 H$ V
    7.3.1 使用Hi
    + v: Y6 t4 E1 a% ^  x4 y0 V7.3.2 使用T' h. ]; Z) z+ W- ?; Y8 P. W2 G" Q
    7.3.3 使用BigData# F  v! |" B3 h% }/ _
    7.4 本章小结( k+ @. R( [) F( u* D
    第8章 BDAS简介5 a% i) v4 ]2 |3 q. Q3 y
    8.1 SQL on ! T/ ?6 L- u4 d
    8.1.1 使用Spark SQL的原因. |: @+ A# M$ i- ]8 J9 v: T6 m
    8.1.2 Spark SQL架构分析3 N, m) x) s- g
    8.1.3 Shark简介
    % D+ Z( f0 i1 G8.1.4 Hive on ) M1 H3 ?7 N: M, C
    8.1.5 未来展望
    3 a$ S: N1 \) E, T+ t8.2 Spark Stre
    2 X4 Q, s* S$ \7 r8.2.1 Spark Streaming简介5 \+ p, N) ~1 q) I4 [; j- g) L
    8.2.2 Spark Streaming架构# c9 F/ t' M+ i8 t
    8.2.3 Spark Streaming原理剖析4 }! r7 z  `3 [
    8.2.4 Spark Streaming调优4 E+ H2 B, o$ T. V. O6 Z5 o- C& H
    8.2.5 Spark Streaming 实例
    8 i7 p0 P0 T( l8 Y3 Y8.3 G
    * E6 c! a# K- K8.3.1 GraphX简介/ ]( m" ], y+ @% Z* _1 g  \
    8.3.2 GraphX的使用
    5 r* f3 c- w" y# R2 n( l0 l# a8.3.3 GraphX架构$ g' R) }( q  Q$ i$ d) f# s- v. p: T
    8.3.4 运行实例2 X. Y; O( [  k+ o( n0 M2 o: M) q
    8.4 3 h; T3 F" ~2 ~& c7 V
    8.4.1 MLlib简介
    # E1 F$ j( s6 k6 b( h8.4.2 MLlib的数据存储4 V0 {4 v6 D' C* e* \! y! S  {
    8.4.3 数据转换为向量(向量空间模型VSM)
    . j4 G5 O* b% k( {9 ~& S$ R8.4.4 MLlib中的聚类和分类* e( Y; |: r( ]+ z& B
    8.4.5 算法应用实例. N* O; Y# u. a! `6 B& V7 O
    8.4.6 利用MLlib进行电影推荐
    , k8 `: \! ^' o' X8.5 本章小结
    8 e7 f. Z' u( z, m9 y$ s# o第9章 Spark性能调优2 ]8 w9 p0 `7 c0 e; o  `1 B7 z3 [
    9.1 配置参数
    8 {& b( A. w3 ~2 d, x) [. j: ~5 c" K: B9.2 调优技巧
    - y8 B* [$ i0 C' ~' T9.2.1 调度与分区优化, @5 [7 |" {& `+ t7 @
    9.2.2 内存存储优化, q/ k0 U+ E( Z& q
    9.2.3 网络传输优化, j$ P- E* V$ M% [( R
    9.2.4 序列化与压缩1 ?# w7 e3 c8 {8 f
    9.2.5 其他优化方法! N% b% {- \2 G  S& `# ^0 M+ z6 i
    9.3 本章小结

    + U# V1 E0 x4 \/ C" I2 B3 ?! k
    & x% y# @3 x9 u2 a

    ! c* `- J. m, p, A4 K, P% i8 ]- q* s4 X7 J电子书优惠获取地址:《Spark大数据处理:技术、应用与性能优化》
    / i/ U, O) K) ]( `& G9 r2 l4 m' {! K# F) Q

    " [! z$ T6 N) E: h
    # @0 o; ~  I# c
    6 L  n1 p$ C7 @6 n( `! }1 [2 ]
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2017-4-19 14:02
  • 签到天数: 4 天

    [LV.2]登堂入室

    0

    主题

    22

    帖子

    86

    积分

    普通会员

    Rank: 2

    积分
    86
    发表于 2017-1-9 19:09:30 | 显示全部楼层
    谢谢分享,感觉特别实用,谢谢楼主了
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|手机版|小黑屋|Java自学网

    GMT+8, 2024-6-16 05:25 , Processed in 0.078622 second(s), 32 queries .

    Powered by Javazx

    Copyright © 2012-2022, Javazx Cloud.

    快速回复 返回顶部 返回列表