|
java自学网(www.javazx.com)-java论坛,java电子书推荐:《Storm实时数据处理》8 X+ i0 I4 A8 ^; ^( D, f
java电子书推荐理由:本书通过丰富的实例,系统讲解Storm的基础知识和实时数据处理的最佳实践方法,内容涵盖Storm本地开发环境搭建、日志流数据处理、Trident、分布式远程过程调用、Topology在不同编程语言中的实现方法、Storm与Hadoop的集成方法、实时机器学习、持续交付和如何在AWS上部署Storm。Hadoop无疑是最炙手可热的技术。作为分布式系统架构,Hadoop具有高可靠性、高扩展性、高效性、高容错性和低成本的优点。
p, C! e" \, o+ U' S( f- T7 m' O0 a' i4 G
' {7 O" ~5 F! `# Z- e8 j& U& D: Y3 k' X2 N
作者:(澳)安德森,卢誉声
" W& V2 M9 O g7 m+ F) M出版社:机械工业出版社* s0 d! ^" ^$ |7 T8 p2 A
出版时间:2014-6-18 ~7 |3 x$ p8 L0 C: W8 J
+ ]1 _# q, ?; Z Z
* _& [4 I: B( D+ E2 _, L* [
& j$ M3 g7 J n: T- ?$ m2 X
7 i" C4 I3 n1 Y9 {9 k1 i u; j$ M, r
java电子书目录: m* u5 {+ y: P9 l. y
第1章 搭建开发环境& N0 Y7 K1 ]( l. T b9 D, J& y
1.1 简介
3 W T+ Z* M+ K- \- L; H1.2 搭建开发环境2 w# [6 ]0 m3 f/ I
1.3 分布式版本控制6 t" S) ^' l" q! R: B$ S. v/ R
1.4 创建“Hello World”Topology7 K. W% n+ Y- i. q/ k; Z, R
1.5 创建Storm集群——配置机器% h7 t' F6 k- B0 @( u: u
1.6 创建Storm集群——配置Storm$ H7 u6 F4 u2 h5 {1 Z
1.7 获取基本的点击率统计信息
0 X" O( v" O6 k1.8 对Bolt进行单元测试
3 j3 _9 Z* L$ M# A1.9 实现集成测试
G5 f: o+ r: G. d N* B3 v8 }1.10 将产品部署到集群* V6 H# P4 t( M( z
第2章 日志流处理
8 n' m p! j8 u2.1 简介6 x( k( _; n1 m* l6 u. {6 |* k# c
2.2 创建日志代理
6 o' d) i4 _+ l/ H4 E/ B: u4 C+ [2.3 创建日志Spout
6 h; [/ F9 `) O/ S: ]# h& ~& F; l2.4 基于规则的日志流分析
( s3 n: Z, C8 N# s3 \2.5 索引与持久化日志数据& C/ r- o2 Y+ R
2.6 统计与持久化日志统计信息& ?5 m: ~! C/ p/ ~6 {( R+ r
2.7 为日志流集群创建集成测试
0 t! |# _: b) C2.8 创建日志分析面板
$ h7 t( r2 ]1 j* B$ A% i第3章 使用Trident计算单词重要度
+ U! }( H9 T) ?; l5 ?& \3.1 简介
9 {4 j. W4 T2 @5 T; p% A) X. h: d3.2 使用Twitter过滤器创建URL流
0 ~/ w2 f) K5 ^' n7 c3.3 从文件中获取整洁的词流
* D! Y* _! t1 M. l- f3 r1 X3.4 计算每个单词的相对重要度- E" g/ Y7 C* h9 C1 ~
第4章 分布式远程过程调用
- m. y- U6 c3 @+ }# \9 n) j' ~) C4.1 简介. Y* Z! S4 c# I/ Z. c% K5 A
4.2 通过DPRC实现所需处理流程
6 A; K% V' H9 e: h4.3 对Trident Topology进行集成测试0 ~9 f: y- B% p, ?0 D
4.4 实现滚动窗口Topology" f4 W ]9 |& a% s+ s. B
4.5 在集成测试中模拟时间3 M: N) o2 k3 W' U) R9 N J
第5章 在不同语言中实现Topology: t2 A/ Z0 N4 f
5.1 简介' U: h r* G% y( X" i
5.2 在Qt中实现多语言协议' n$ _( e+ S1 V. q6 t8 A6 A$ ]+ O( g. }
5.3 在Qt中实现SplitSentence Bolt
. u" Q4 b" |7 R$ g' O5.4 在Ruby中实现计数 Bolt
- ~. O( I% c% h- G0 ?- J/ {5.5 在Clojure中实现单词计数Topology
K& ?' ?) `* E1 b第6章 Storm与Hadoop集成
7 x) w) k! Z0 Q- W: W; ]3 D6.1 简介( I6 l; H4 Z3 e
6.2 在Hadoop中实现TF-IDF算法7 ~* e4 v& G/ P9 j# a- \! x+ r
6.3 持久化来自Storm的文件
4 ]- U9 }9 r% q0 f, d- ^. h6.4 集成批处理与实时视图
7 L" y' Y, u5 E# q第7章 实时机器学习. J+ P- g- h! _! Z5 _8 s
7.1 简介/ n* g" c. v2 R( ?+ {
7.2 实现事务性Topology; r1 n, e' I/ S% Y2 V
7.3 在R中创建随机森林分类模型0 X0 h! v1 J/ `3 i }
7.4 基于随机森林的事务流业务分类" E& E- t& T- _0 Z1 `; K
7.5 在R中创建关联规则模型' B+ B: J6 P+ x& A1 r
7.6 创建推荐引擎
% S" g2 {3 {( _" C3 W! N* c0 U7.7 实时在线机器学习! o9 l" L, k( o% r, U: @0 q
第8章 持续交付
; f" H+ Z, m! m \0 n1 l8.1 简介
4 ~ g' v$ N) f; ~8.2 搭建CI服务器
) Q1 J& I6 `, w* F8.3 搭建系统环境7 w' j+ O. E4 P: Z# y+ u
8.4 定义交付流水线6 H4 V4 V) C& s4 u3 O
8.5 实现自动化验收测试
$ ]. H: Y4 g* a+ }) f! V" q3 `. j第9章 在AWS上部署Storm. M+ z# u0 m2 e3 I' h* M. Z. O
9.1 简介! V. h2 y! K5 c9 I! t! l
9.2 使用Pallet在AWS上部署Storm" q$ i+ ? T( _. E/ W8 d5 S3 \* U
9.3 搭建虚拟私有云
$ F1 D$ V2 p, e: O+ s) [1 `9.4 使用Vagrant在虚拟私有云上部署Storm* m' ^, }# E- w0 _5 u
. H* a& E" Z& C2 n d, I9 T6 Z4 @9 r+ Q% Q) ^8 W
百度网盘下载地址链接(百度云):java自学网(javazx.com)Storm实时数据处理 PDF 高清 电子书.zip【密码回帖可见】7 s( E: g; W% L3 h" u
1 h+ i% X+ e! ~! m# ~. x7 i$ @- ^+ B& e7 A' B! V
* W& Y- o/ a, y
|
|