TA的每日心情 | 开心 2018-4-8 22:14 |
---|
签到天数: 1 天 [LV.1]初学乍练
普通会员
- 积分
- 5517
|
java自学网(www.javazx.com)-java论坛,java电子书推荐:《 Spark大数据技术与应用》
7 Y) e5 ]& z2 C: ?java电子书推荐理由:资 深大数据专家张良均领衔畅销书作者团队,教育部长江学者特聘教授、国家杰出青年基金获得者、IEEE Fellow、华南理工大学计算机与工程学院院长张军倾力推荐。 本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,后落实在任务实现环节。 全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Hadoop大数据技术。 书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
) \, t+ J, I/ n* g" w- j% f/ a& ]
5 @' c: O5 d& k8 i+ D作者:肖芳 张良均: ^" ^# d! h" y: S! C% S7 s
出版社:人民邮电出版社: V) K* S5 r3 f. u3 F
出版时间:2018-02-01
$ Z+ ^9 y$ e& L5 C" I, Q书籍价格:39.30元
: A+ V/ p5 s4 Q
$ \# Q; [$ D1 R( k9 i+ u( E) }" a0 Q
2 k3 Q& k) J& h" b" M0 ?9 v# N& l; k* @% x$ n& V- b9 O
java电子书目录:* w; _$ T$ k( {% |
第 1章 Spark概述 1
" ~8 Q8 T0 h6 h$ L
) f5 D+ T; k4 D任务1.1 认识Spark 1
/ K t6 }, n( m, L( j; d2 N0 [9 x9 K6 W
1.1.1 Spark的发展 1
( m" H: \' A1 M$ T& X
4 `3 A" _- ]/ D1.1.2 Spark的特点 2
8 ^/ v1 Y5 M* e
7 Z1 f) x$ w5 ^1.1.3 Spark生态圈 44 P# G, J* P$ K) I; a5 E: x
5 w' q' a( T3 B
1.1.4 Spark的应用场景 5
2 w! Y/ s3 U4 ?. ? ]4 B" p+ N4 ?! k) Q6 q3 _! D
任务1.2 搭建Spark环境 5
! T2 w" P/ S8 F1 F4 [4 {$ g, U
3 ]& V' g) z4 j1.2.1 搭建单机版环境 6" X3 n* _$ {. n: k( V6 p/ l
W% O+ ^+ s' ~! T, {( d
1.2.2 搭建单机伪分布式环境 67 x# [/ z: P5 D1 r! g5 W
" k0 ~ A p" y% m/ s( ~1 Z! T
1.2.3 搭建完全分布式环境 75 G) B/ H F) g8 x ~5 W
" F8 P* s7 `+ d$ A0 [任务1.3 了解Spark运行架构与原理 10/ p5 W; m! b: y& C/ B0 O& l, d
8 O: q$ S2 Y8 H/ s* x: q* B Y
1.3.1 Spark集群架构 11
+ g- L: t4 h$ a
7 S* J6 D. S @) m6 R4 ?7 |1.3.2 Spark作业运行流程 11
; y% u5 v7 C1 d& X+ _' ]" h% n& ^% I' q2 B5 ~/ A& L/ q
1.3.3 Spark核心数据集RDD 15
$ T8 _% m1 V% b6 E0 P. w u. R- X X0 e: E$ [5 ~: j
1.3.4 Spark核心原理 17
1 D& S f" X( v; T5 C# p; d
# w& u: Y! O7 Q* T, B, k; ^小结 19
' v2 f* v0 p/ S+ e" D. K" E( P
2 {1 o: W$ v. I _第 2章 Scala基础 20
5 _9 K" M$ n0 o. b( J5 n6 m
* p) }0 G! @6 b5 W9 F任务2.1 Scala的简介与安装 219 I3 f$ Q/ ]8 k$ \
0 u u% E) l2 u0 T7 _3 |. [2.1.1 Scala简介 212 r: G' F0 S% @5 F5 @- z* j$ ^, C
, g, Y/ h$ B" ?2.1.2 Scala特性 21
% ~4 H; _2 a D* {4 g6 u2 ]- j9 S- X& p6 |. @" a
2.1.3 Scala的环境设置及安装 216 I" s$ M! ^" v0 z, Q* k, b
# |6 Z9 E5 `8 B8 R2 E) i+ Z
2.1.4 运行Scala 23* c3 ^& ?1 R4 \6 Z4 L
) Y s* G9 e. p0 l) V任务2.2 定义函数识别号码类型 24
$ K4 p% ]$ J" i/ X5 Q1 L
6 l o2 Y0 C5 w1 ?$ N- E; U( \2.2.1 数据类型 24, |, j& @* y4 U$ L; ]+ V
- d8 r; g- j8 `5 s" H! [; z d2.2.2 常量和变量 25
4 A% v5 L1 A7 x+ Y7 `# G' M0 H1 y" A8 Q& w5 n
2.2.3 表达式 26+ k {1 ^. c8 o
9 v, E7 n: v* t( V8 p4 `4 L9 L2.2.4 数组 27
8 h& G- _: T6 r1 ^9 d7 j9 b5 H: \' f
2.2.5 函数 29
4 J! O: I/ `4 l3 C$ Q+ K. k& Z4 o4 @( Y# T+ \, `" E1 l
2.2.6 任务实现 31( Y3 e# }+ O2 }9 I k2 _
) r1 d: T& L6 `5 |
任务2.3 统计广州号码段数量 323 Q9 ~8 E% q0 o3 {! M$ R
9 ?2 |, i; I- c# N1 E9 N2.3.1 if判断 32
8 B3 }( w# z, O0 H5 F" o1 B1 i# t& j# }) e9 o/ N. I# A
2.3.2 循环 33& }7 H. u) f1 N7 Y& W
' |- l$ k4 f0 S) |* K( a2.3.3 任务实现 34' r$ t# e: ^( v$ l( G7 d" J
, m# n a( `: P: G7 E8 p
任务2.4 根据归属地对手机号码段分组 34% w( p3 r/ ^7 u ~; i! l; w
$ ~$ b" s/ r7 E
2.4.1 List 35
1 f$ S, J1 T" `; _" O% ^8 H: z! }! C7 b: v3 s2 b1 g* { M/ x5 Z3 y
2.4.2 Set 368 x+ Y) K2 L* X% U
3 L" Q% H2 g- c/ o2.4.3 Map 371 e x9 J5 Q8 Y& l' ?8 N
' d; ^* p9 y- ]. I! ]7 c4 I2 L$ t
2.4.4 元组 388 @4 a: E, |8 I/ }" w- F0 D
- A# ~0 ]* H. h' N: c
2.4.5 函数组合器 38
# K: H* [# }; k# f; I* i
/ r$ ^* U$ ~( d3 c3 U% e# C9 ]: y2.4.6 任务实现 391 k& a7 q8 o' x: x( c
- D+ V) \2 M3 o. K: o任务2.5 编写手机号码归属地信息查询程序 40& A$ p! |+ x8 h: R- M: U/ p, w
/ k9 F! P' I9 E8 W2.5.1 Scala类 40
! i5 l3 z; M& ~* d% V% T5 a; ?7 E, r+ K% T0 b
2.5.2 Scala object 425 ~ e) ]. G l* L5 S: ~
; W Z- }& b( s4 O# ^4 f( D% ~
2.5.3 Scala模式匹配 42$ y0 `; B7 x9 O+ D$ W5 O
0 n' R( a: r* p! w2.5.4 Scala读取文件 44* d: G4 o$ i! ?5 Z! ^( P1 a
5 ~/ B6 n& `3 d' ?! f
2.5.5 任务实现 44+ b4 I0 }- ~" x, W% i u9 q3 ?" c
) h$ ~* E& e2 W) i0 N) f. O) _2 I小结 458 ]/ `: O$ i9 x" z' v
$ p6 \# {1 c7 g7 P+ m
实训 45' W* H$ h: d0 O& d
, P7 \4 p2 ?" f) d实训1 编写函数过滤文本中的回文单词 45- v+ N2 @8 I: P/ p7 X7 w! a. A
6 C2 ?: b8 H' X: X1 j实训2 使用Scala编程输出杨辉三角 46
2 ]% D5 R7 f% S- O* @, R' N# ^! Q- ]; m
' ]4 l8 t- }1 Q9 v2 d课后习题 46
' @" Q O# W( j3 [# e( E
+ ~" H2 e9 x* D+ }7 ?8 L( ~第3章 Spark编程 485 U# @ J& C$ Q
9 }+ S; g4 ]3 q" ` o! c
任务3.1 以学生成绩数据创建RDD 49: S& o2 U h3 @; _3 [( o" C- _
2 V" D$ f b8 O7 r3.1.1 从内存中已有数据创建RDD 50
1 K" k: ^; t8 [/ ^2 X% M s1 {3 N$ [0 u6 s4 D1 S
3.1.2 从外部存储创建RDD 51! K: |( K6 M0 x' H0 e% Z( ^7 L: T/ X
% o. P$ n. Y5 e( |2 y9 ~8 C" `
3.1.3 任务实现 52
* }' ? V' T/ |# j; D
a# j$ I2 Y& L+ S任务3.2 查询学生成绩表中的前5名 52
, c' b8 c7 o% X( s
9 n! J# s* i; D: W. q3.2.1 使用map转换数据 52
0 P' z0 l1 k- D& r' _# ]9 v
m9 W! X8 I/ o+ \& A; y" v3.2.2 使用sortBy()排序 53
: \' B1 N1 t+ D) x
: w& L, W# @. S$ x3.2.3 使用collect()查询 538 {8 C* ^5 y' j0 }0 ]
! Y2 ]" j# i, f6 I! o+ w0 @
3.2.4 使用flatMap转换数据 544 J" R% [# T+ n7 }' h4 z
/ u' O" ]- Z: N# `3.2.5 使用take()方式查询某几个值 54
4 i1 w" M; C0 V+ ^2 }9 S( I9 @
8 A2 {/ c8 L$ X z7 w: ]' f3.2.6 任务实现 55% o& |& o! y$ e9 Y( S$ w4 v
h0 L& r+ l q任务3.3 输出单科成绩为100分的学生ID 55
: o3 \) U6 j' A2 ]" ?# D! f2 {" I" z/ |9 ^# f5 H* e0 G% @9 t
3.3.1 使用union()合并多个RDD 56
" H% r7 ]3 s! x- [. v3 I, C- U& Q8 `: V- W
3.3.2 使用filter()进行过滤 56
: N6 s: l/ @. e0 @& T$ W8 R; D- D! i3 m4 n$ D2 n5 d- [
3.3.3 使用distinct()进行去重 56
2 ]2 o0 V9 p `, ~3 u0 L- ^
3 S: V, f, _/ Z- \; z3.3.4 简单的集合操作 57
/ i. u) D. f7 u' O" d0 d' _- ~$ O- W- e- J6 `" U" t' d" q0 b
3.3.5 任务实现 58# ^4 d$ j( ~) s. E
. k! u3 Z C. E" D0 i m任务3.4 输出每位学生所有科目的总成绩 58
7 g; d5 S$ y7 J3 t% D w* B1 U7 C. Q2 r. H
3.4.1 键值对RDD简介 59
4 N' G3 v% T7 }+ ~, s0 ^3 C$ s. O8 Y5 q- g$ P- S& O7 }, t
3.4.2 创建键值对RDD 59. o) l+ ^& x6 u3 c' g8 s, U
0 p3 ?$ b0 H& p! o% `3.4.3 转换操作keys与values 59
3 H1 |" }* }$ a: w) m
$ B; z0 `& Q% c4 a) v! ?+ |4 w8 r3.4.4 转换操作reduceByKey() 60
" m! f4 N O+ V' Z9 C K. o) a _% `7 m* h, E
3.4.5 转换操作groupByKey() 60/ O- I5 c+ e+ ]: K8 O/ F
( w+ i9 t5 X. V: E' u0 O3.4.6 任务实现 60* K5 i) v* ~9 t' f, P* p
! S- P) b5 C1 E8 C" g- _
任务3.5 输出每位学生的平均成绩 61
9 f- \3 t% L' e/ d0 I6 Z* ?$ p( D1 ]9 F7 w. X% O0 J
3.5.1 使用join()连接两个RDD 61
1 `" l2 ~8 `( @# l! A0 M; k, [
/ ^ n9 U& W" m6 ]3.5.2 使用zip组合两个RDD 63
% s% A" w6 Z/ Y( K e. Y) [0 o
' C1 Z- U7 \4 }" }- U3.5.3 使用combineByKey合并相同键的值 63/ O ]5 V- ^" e! H: S3 p
$ j K4 `' x) \) ~3.5.4 使用lookup查找指 定键的值 64) i6 y! c1 e* C* s0 E* Q+ x; D1 V
8 q5 N: Q2 P, ^. {
3.5.5 任务实现 64# X7 x8 ~' ]+ A8 M0 c; v6 V
" F& S2 X# i5 [3 |2 h' Z/ q任务3.6 将汇总后的学生成绩存储为文本文件 65& Y) ?: P0 C8 x
3 Q4 b8 |1 }; ^1 N3.6.1 JSON文件的读取与存储 65
/ x) y3 Z( V0 y2 N4 N7 U! y+ M
, u" d/ o$ i, z+ b5 F* ~" ` l3.6.2 CSV文件的读取与存储 670 @( z+ B; \0 |/ ^* u
- O; s% y; t1 i* }. p" Y
3.6.3 SquenceFile的读取与存储 693 E! g( v3 ^3 ?5 H. Y
1 ?. }3 o! V7 H% v0 J) H( T2 Q
3.6.4 文本文件的读取与存储 70) C6 z, W f3 u' i; Q5 x
+ d7 e3 n u0 R3.6.5 任务实现 719 v0 ~9 N- _3 q8 Y, W* ~, d7 q4 |" S
( @4 J% A, f' \- h5 t4 W
小结 72
3 V2 {0 A; Q; l6 c5 l' c
0 v) A4 N# D6 ~) t9 l- M实训 72; Z6 e5 g6 Q, q7 _7 c3 c. D
9 z4 y4 o5 q; U6 _ ^实训1 统计文本中性别为“男”的用户数 73
: P1 ^/ s+ i5 l) x/ O' U2 J' y. G2 P
实训2 单词计数 73
: y; ^3 d8 J1 L7 U% \( Y
, o; h" @! `; N6 A; K' S2 j课后习题 746 ?/ J! E! Q3 D9 E! q# ?$ t, ]
9 H) Z( O0 U4 Y7 U; D
第4章 Spark编程进阶 76
" B2 R( ^. S) W2 l2 h$ c- W
, Z+ K6 w+ h7 L9 u! _. V1 D) l ]任务4.1 搭建开发环境 77
5 m# S# A+ O; C! O' O' O% L1 ]! o5 f0 u2 `% z- N; z6 S
4.1.1 下载与安装IntelliJ IDEA 77
% o* {4 e5 O- Z$ N+ i& E2 f5 K# Z4 ~7 L
4.1.2 Scala插件安装与使用 794 i/ W/ `, V. E7 s' C+ i V
! W& H- r& ?: N0 @4.1.3 配置Spark运行环境 84
7 \0 r; L# N: p* {6 ?+ [8 \. v( i
$ n+ s c' L9 Q- ?+ u3 F4.1.4 运行Spark程序 85+ E9 O6 |/ j3 |) m! T9 ?6 h
3 x7 b$ S5 X* q# H u: Y8 R
任务4.2 使用移动平均预测股票涨跌 92
8 R( R$ A% Y1 d) q% h7 G* O! a
4.2.1 持久化(缓存) 93" S4 \' E* Z# L1 K# R( k
( C5 {8 V; n- _4.2.2 数据分区 94
! U7 [- @- D# @2 m& U3 A2 R$ Q6 a$ h) ^
4.2.3 计算价格波动幅度 98
% y4 e- U. z, E$ u4 F8 v: b
! y* c @. w* F1 v$ O4.2.4 任务实现 100) J# l# [* D* x q5 x
) s) V/ s0 T/ M& X2 x; u9 a小结 1030 W$ F' p/ D. [8 Y- b' ]
4 K# S0 z' e# E( q5 X) L. `8 |1 ?4 |实训 1034 |5 n1 q) n4 N( Z
' E9 I/ O) I$ h. _0 B' C+ Y
实训 竞赛网站访问日志分析 104; N5 n: n! n& C+ ?1 d H
# J" s& K6 a- P课后习题 104$ y% k9 R1 w S2 O3 x
- v/ `: o5 N6 {, ?7 H$ O
第5章 Spark SQL:结构化数据文件处理 107
1 B4 P: s5 Q U& Z- p3 p2 ?1 z
+ ~+ e7 ~! {1 z) d+ U+ A7 m任务5.1 认识Spark SQL 108* i# L: k( p5 P$ x
# {% T" I, g' C/ @7 ]% n2 p' s
5.1.1 Spark SQL简介 108! ?, j( ]1 Z; I- Y
( D, R; \& s; x6 k0 `5.1.2 Spark SQL CLI配置 109" S3 F* N; s5 | }
9 ]" \) V) z* X8 R9 {# e
5.1.3 Spark SQL与Shell交互 1107 `& T; @/ Z# N/ ^* N {
; B: Z5 Z5 F+ `
任务5.2 掌握DataFrame基础操作 1118 N1 G8 W. Q+ N) E7 M* v% f
* v( N, g) k; G
5.2.1 创建DataFrame对象 111( C' X+ ]( P& h4 A# j
2 a8 [. _- ^) y- w9 u
5.2.2 DataFrame查看数据 114# J T. X8 V5 \+ s% o
O; v8 ?* O( ?7 F8 c5.2.3 DataFrame查询操作 1174 X3 v$ } ]+ [- D/ R$ k ] i
& A# V4 k2 C$ Z8 I2 Q7 }5.2.4 DataFrame输出操作 123
% B8 E/ k6 J, W, f# n! O+ m
) v# y0 \" I( u3 r任务5.3 探索分析法律服务网站数据 1254 Q0 |5 U2 G$ n& @! K, w
0 J( {' f. F1 y* j, b9 w& c/ z/ `5.3.1 获取数据 125- m0 j/ q/ \+ l# E A! T5 V
7 s% {8 d; Q( v& ~7 i5.3.2 网页类型分析 126# E" L* E: _9 ^* ^- l5 k! N
& }: }1 U- r& H% A4 R; ]5.3.3 点击次数分析 131
. l$ l# t3 [) ~1 v0 x: a m5 A
9 \$ H# D/ w) S5.3.4 网页排名分析 133
' ^! t, \5 a6 e4 g2 D
" V. a# T5 {3 z( r7 R% p, \3 g2 e4 i小结 135' q% @ A/ F1 `; `
( ]+ j% w% H- d7 |/ F/ {; ^
实训 135# V( ~; `8 J6 \, W. p! |
8 e# h* l7 z- ]6 e; U实训1 统计分析航空公司客户数据的空值以及异常值 135/ I: Z1 ?# E% o
# W; U1 s2 ]8 i9 V) n* N k实训2 统计分析某公司每年的产品销售量及销售额 137
- Y1 x$ \1 B3 K7 C9 i4 ^
2 i: E% I7 |; \1 P/ _9 b- Y课后习题 139
5 p* Q7 B5 \* x! _* p* g; V O) v+ p4 u! S) U* K
第6章 Spark Streaming:实时计算框架 1418 G& H: P6 P7 t! O' D
X% ~5 \) Q4 Z+ _任务6.1 初探Spark Streaming 142
! C. C- `0 Q" H( q0 ` x' u& E% w, o% S, {% Z2 ~# |
6.1.1 Spark Streaming概述 142, T8 E, w$ F: P! f
0 B+ b; G; O& y) m( b& J6.1.2 Spark Streaming运行原理 142
( ?$ ] C9 x7 i+ n/ P/ O T& u% j# j* t
6.1.3 初步使用Spark Streaming 1433 F7 J2 ]4 Z$ Z; w. l; a7 b9 h' e& l
6 I0 @" a8 q, _, L% ^0 V任务6.2 掌握DStream编程模型 1454 Y* M O+ i- m" ~9 ]: L) I
7 m- f9 C- g0 ^% {0 W7 I! ^" a
6.2.1 DStream简介 1461 B( o( E% r6 e! p; H6 P
) r; S, H7 F$ [7 W1 D; t$ {1 N
6.2.2 DStream转换操作 146! y" U, p- u" K/ y2 Q" s0 v6 M
& |5 k' C+ D) C! r7 M
6.2.3 DStream窗口操作 148
- f+ p8 a. A2 M
! q( {$ O0 l4 l7 c9 @( I. {) _6.2.4 DStream输出操作 151
9 Q, u7 c. J! s0 y9 C& K
& T6 F7 b" J6 R$ Y. R$ n' d, D任务6.3 Spark Streaming实时更新热门博文 155& J) W' |' ^' B" ~" v
' |: @0 G Q! b6.3.1 Spark Streaming输入数据源 155
$ l: W' y* w1 a
a4 ^& {3 n8 o: X6.3.2 Spark Streaming计算网页热度 158* k1 U9 f( U* u* H& Y0 d0 r p
" U8 Q+ y' b) ^4 m6.3.3 网页热度输出 158( z4 P2 W/ Y/ c7 Y' ~
6 a b- A {+ h7 B$ m1 l/ C7 T# ?
6.3.4 任务实现 159& v+ \! F" R/ l k) j" J7 n
8 ~1 y `* z& d. s6 E3 y5 w
小结 161
2 _; V8 z1 V: ^7 b6 ]3 m6 V: ]/ A' _# z1 d) c* r$ S
实训 161
5 n4 x( ~. d+ V8 P2 W& y" ?% O4 K2 } r1 t+ e1 E# n3 Y' |
实训1 过滤打印包含单词error的记录 162
- |8 v1 U; j2 t O: T/ b
# U% k8 @- Q- @实训2 实时过滤歌曲播放次数超过100次的记录并存储在HDFS上 162
% r9 r5 c* }, [2 V4 Q, o
$ D p* t+ x! V8 N课后习题 162
0 D/ `1 v' i. V6 @
& _9 C! n9 c: e第7章 Spark GraphX:图计算框架 1658 a( ~$ P! g& {) u" x1 A$ p
6 h# x1 M$ K6 n) T! R! G
任务7.1 认识Spark GraphX 166( V+ b2 V4 D& P* M2 x- O# a
, o N" r0 A4 k( S% F+ x6 c7.1.1 图的基本概念 166
* U, q. a1 |% f; q0 ]1 \: g# y$ z; x u* l" m
7.1.2 图计算的应用 167
6 r( S! I+ B1 T. L$ o7 d
" Y8 p1 I/ W$ T4 r u7.1.3 GraphX的基础概念 168" z9 y3 q" _. v. g8 V
( l0 h# ^- h" x1 G3 J& Z8 [) `% W) _
7.1.4 GraphX的发展 168" e- Y: a. N I8 N8 I
, |7 h- f; v4 j8 i+ m
任务7.2 了解GraphX常用API 169! V4 a# Q. }) ?/ n0 b9 x
1 c9 n7 ~3 A: c) R: |2 J) j5 \2 O
7.2.1 图的创建与存储 1698 @2 L: Y y2 E6 n& M$ f
: c5 G/ K+ p" Z7.2.2 数据查询与数据转换 174
3 N+ p" S; r6 n8 S e h* |- f1 D# k: K+ q" j% ~
7.2.3 结构转换与关联聚合 180' o/ p' ]9 ~5 |
8 X/ U6 z7 P7 t9 C任务7.3 构建信任网络并找出目标用户 187
% c6 x) f8 k3 `/ ~& I' b% u( m. T! v: D. ^; Q3 u# Z+ {$ ?( j
7.3.1 构建网站信任网络 188$ L' l% a, `/ m8 R h! h+ ?7 h
) G: Z: O) T" H; O* a7.3.2 找出需要支付稿酬的用户 1889 W ~ |! V1 m/ W; ~4 L1 y6 k
3 i) T; O: r7 c( T; F7.3.3 找出进入热门榜的用户 189
, t" p) d G3 v# R! p
* x' Q3 a; y5 D" C$ P小结 191
6 Q4 [9 ?" Q8 }" t+ h0 ]
" D; K I: T9 g/ W) I2 [ ^实训 191$ q# K4 d4 p+ c0 d0 i4 R
4 k% n' r# K# a实训1 使用PageRank算法完成网页排名 191
1 }' @/ N* v N/ B. _0 K, q+ k8 y/ M* j5 Z/ U. G' g
实训2 利用二度关系完成商品推荐 192
) ]9 Y8 q. v. ^2 h' e, j* m- A( X0 i
课后习题 194& F7 @, V2 u8 b. y/ ^3 w' G) q
- L! R! W3 c" @0 Z9 b2 Y第8章 Spark MLlib:功能强大的算法库 1964 w+ f5 _ ~/ U. J* l
5 \! B0 o. Z4 j
任务8.1 了解MLlib算法库 197! B* V" e/ M9 N1 j! i
9 l' N$ f h- x6 b% I& L1 G$ q8.1.1 机器学习简介 197% g9 Z" A# L% l
/ t! i: d% G) ~% s! k) ^/ J( c& b8.1.2 MLlib介绍 198
* n' R7 U6 |* I
9 l- w1 Q6 k/ J+ \任务8.2 以Logistic回归实现用户分类 2124 F8 U; ]5 D# @: Y# w
1 S$ a& u- r+ ~ m2 I8.2.1 分析思路 212
1 s- N3 |4 z- J/ J; A G6 O6 M) ^9 o+ ^, V" m( u8 i
8.2.2 数据处理 213
) [1 h& a8 f" O
8 Y: l9 X P6 `9 M. |$ N8.2.3 MLlib实现Logistic回归 215
9 v8 ^& [: T4 i
) a5 @- R8 R+ v3 M2 K8.2.4 任务实现 217
8 n7 }' ]& h! s* k& F: E0 p0 J9 w- O Q9 L
小结 221
5 A Y8 ~9 m9 N* F2 v; _
( T$ h2 X7 h2 Y+ H% u( R实训 221 D2 z0 J* A* d
+ C( }1 f! D4 e- j0 ]实训1 通过KMeans定位商圈 221
( y) i* h4 v o
5 M! r$ h$ i: L, R实训2 朴素贝叶斯进行文本分类 222
C! W+ t _9 `: a% I8 W- l1 Z6 g+ w4 N3 w
课后习题 223
! m. @- i% C, d" a: J
' M5 H `1 c4 H7 l' q' `8 C h第9章 项目案例:餐饮平台菜品智能推荐 226
' ~% \4 C. Y- p! h- n0 r- `) N* w. c! {
任务9.1 推荐方案设计 227: S) R4 @' Z( O! z& Z
) n( m3 `7 H8 \$ z9 P; x3 k/ _9.1.1 用户数据分析 2271 [. [2 J3 n6 @# p3 V
8 w7 N4 v/ L0 k9.1.2 常用推荐算法 2294 D. l$ D" m' A+ U
+ [3 j5 h1 `5 ^& e( v7 C' g9 p& X7 P
9.1.3 推荐流程设计 231$ ^/ {7 n& K6 O4 i2 ?0 R( G
3 F Q% i3 Y3 A* ]0 N
任务9.2 数据预处理 232
+ V' L9 |$ b u7 b: G* c9 U H" B# C; A
9.2.1 原始数据探索分析 233$ E1 K# y3 i8 L& Y' n1 P e
' L8 R x" P* {" c) m: J/ e
9.2.2 异常数据处理 237, U3 [1 S" [" r: C. _
& y8 x n+ h1 v* t: `; y3 c' Q9.2.3 数据变换处理 237* | C0 p, z `% o, ^- e
/ r; e3 b; E- U3 m' |0 F: {
9.2.4 数据集分割 239 {$ i4 M( L! ]& L
% A- p9 @( ` m, Q4 W2 s任务9.3 建立推荐模型 240
; X9 f; l5 U& a0 `+ Y$ @! _; x& a. i+ Q
9.3.1 以基于用户的协同过滤算法建模 2407 O! E( [, p0 C. C. O( D% J
: G( Z' Y; Z' }0 y. S, z1 o
9.3.2 以基于物品的协同过滤算法建模 243! G4 x) m5 N9 J$ c9 q) C* ~
z8 Z! k' _3 _/ G
9.3.3 以基于Spark ALS的协同过滤算法建立模型 246- A* D' \ r' ~" Z/ }; j: z
0 J& F3 a% c$ X2 U: a9 e9.3.4 推荐模型的评测 251
- R v8 ]) z8 ]7 M( h9 K0 ^0 E# e0 k
' A8 ~1 G8 P h0 Y W任务9.4 使用模型进行菜品推荐 2624 L2 f. Z8 i6 f* G) P8 H: s5 P& G ]
/ M- m+ B/ o3 F' R X6 G9.4.1 对某用户推荐10道新菜品 262 e/ G; G6 l% I' b8 w! B
4 ~( a p; c5 F ]! [9.4.2 对所有用户进行新菜品推荐 267
' s) }! ^& W5 ~# e: H
% o" h, ~. Y2 c" m小结 272
2 U% _, y: n) @( m6 R) s3 _, O% y- f6 |% f! O, s; o' I; ]
Java资料百度网盘下载地址链接(百度云):java自学网(javazx.com) Spark大数据技术与应用 PDF 高清 电子书 百度云.rar【密码回帖可见】- \8 F' h0 l' m. v. V
. p( Z8 p8 ^, @8 w0 W: B( p$ u" D0 q: s0 C4 Y4 T
8 D( ` ^7 `6 @$ Y; z. \3 S. X* Z/ c6 x
|
|