java自学网(www.javazx.com)-java论坛,java电子书推荐:《 大数据之美:挖掘、Hadoop、架构,更精准地发现业务与营销》2 n8 l+ z3 a1 @5 m, m
java电子书推荐理由:本书以基本概念和发展现状作为切入点,对多种大数据关键技术进行逻辑性阐述和分析,同时结合典型应用领域,论述了大数据技术在通信、互联网中扮演的重要角色,系统地向读者阐述了大数据的内涵。
& U; _1 s9 d7 I
: E/ |- q" T. x作者:黄宏程/ Q. X" R9 L2 c1 u
出版社:电子工业出版社
) J$ ^# ?" Z+ b6 _- w出版时间:2016-07-01 ' S" o4 D% T, G' P# _3 t
书籍价格:46.60元
I/ U6 F: Y# x3 H( Q) P
3 c( k" j u" @1 ]/ l* I5 {
. h; m) I4 D" G* B* ?9 W- v& e! ]' {$ D" |! p/ a! n
I: q. L, m5 Q' X- G. u7 y
java电子书目录:9 i; a9 D! z$ H! W% \
第1章 大数据概述 1
) d4 J' I+ M" V8 p9 J1.1 大数据的概念 1( h4 F' ?& b% w
1.1.1 什么是大数据 1
J, C* L5 o* N4 |1.1.2 大数据的产生和来源 2 M" O5 ~& g h' H5 Y, g
1.1.3 大数据的技术 3
9 p. G) y* O7 @1.1.4 大数据的特征 8& h4 R' @$ Q+ t: \# g/ _( f& [
1.1.5 数据、信息与知识 10
1 f, K0 G/ ] z7 Q& ^+ a% r1.2 大数据的价值与挑战 10% ?' c6 B$ r( q @; j
1.2.1 大数据的潜在价值 11- l: N2 n1 }4 \ b$ V
1.2.2 大数据对业务的挑战 12
; y5 J) x: t' t& P1 ]' e+ p9 A1.2.3 大数据对技术架构的挑战 13
% d$ m1 x& V& {4 O+ H1.2.4 大数据对管理策略的挑战 14" A; Q6 c7 [8 j5 }- J i# k
1.3 大数据与相关领域的关系 16; y/ j6 e8 C" T7 f
1.3.1 大数据与统计分析 16: f" l' y; r @1 v
1.3.2 大数据与数据挖掘 16% E. X1 F4 q1 E8 ]
1.3.3 大数据与云计算 17" K9 r. s P& a! {2 `, Y
1.4 大数据发展状况 20# {: h, C; n: I
参考文献 23- e3 y9 F! y9 {+ L
第2章 大数据挖掘技术 24
& {3 F0 l- K, W2.1 数据挖掘与过程 24) r+ V/ T( K. }# t7 P# P
2.1.1 数据挖掘的七大功能 24
/ ~$ @, g2 E/ b* y3 r9 y. v: k2.1.2 数据挖掘的实质 25
5 w. r& d" T' K5 ]% S% J2.2 数据挖掘过程 26
2 |. c0 D6 I; p8 ?# y2.2.1 定义挖掘目标 27
, ]% N5 P$ x, E2.2.2 数据取样 28
|" G% b; V6 y% J2.2.3 数据探索 30
& n" s' u4 c8 W' O7 j2.2.4 数据预处理 32
. @8 ?' D0 \4 g* h: e2.2.5 数据模式发现 37
' o( {+ T$ h# E7 ?) J4 O9 z2.2.6 模型评价 40
7 x. C: I! [- q: ^4 F: R' ]9 h3 z& J2.3 常用算法 472 z! c9 U$ l* w l5 F
2.3.1 决策树 48: W2 m7 ^7 i- k, O, L' l- z
2.3.2 回归 50
. N) T' |# a: W4 D0 t2.3.3 关联规则 54
7 r5 B1 s/ T5 `9 I& K( V( C2 C9 H2.3.4 聚类 59; g4 M `9 T8 ?3 u- [2 u4 @* {
2.3.5 贝叶斯分类方法 660 W: H5 t8 d3 S
2.3.6 神经网络 69- L6 K4 m5 h1 [5 N
2.3.7 支持向量机(SVM) 73. b0 i# b L0 r8 C3 t4 M
2.3.8 假设检验 77
. g1 ^; I/ t3 o1 l. v& J2.3.9 遗传算法 81& m2 Z A( T8 [& C& C
参考文献 84# ] `# S7 \; X$ K7 ]) _
第3章 大规模存储与处理技术 86& n; }1 z& g1 ?5 q3 [+ Q2 Q
3.1 Hadoop概述 86. I/ p1 E8 ?: b8 V' b0 }/ A
3.1.1 什么是Hadoop 86
& d! j$ k7 F- Q V( E& e/ x9 Q8 v3.1.2 Hadoop发展简史 88* a0 I) g- q+ ?" s
3.1.3 Hadoop的优势 90
! ?- d E/ ]; U- B3.1.4 Hadoop的子项目 90
( L+ z, J1 l9 Y/ t5 T9 s6 w3.2 HDFS 928 ?3 e$ i: n6 g; H8 K, L3 e
3.2.1 HDFS的设计目标 93( m4 s$ F8 E" T
3.2.2 HDFS文件系统的原型GFS 93
: b( b/ v; \' B8 f1 H. S' B/ U W0 A3.2.3 HDFS文件的基本结构 95
- [$ J" H' V* v& I3.2.4 HDFS的文件读/写操作 97
0 j, L% k1 v T1 M9 L3.2.5 HDFS的存储过程 101 D; ?. f. O7 `4 W% O% _! V% i1 x
3.3 MapReduce编程框架 105) J' y# N2 b2 W
3.3.1 MapReduce的发展历史 1054 M; f9 s9 X( n q/ B0 A
3.3.2 MapReduce的基本工作过程 107% @ y1 f7 s6 i$ v. r' S; ^
3.3.3 MapReduce的特点 110
: I4 o: d# e0 R, j3.4 建立Hadoop开发环境 111
a) E; K5 o2 y g% j s( G; ]% y9 w3.4.1 相关准备工作 111% X; c" m W- Z' Q m5 K6 y) L3 ~( Q
3.4.2 JDK的安装配置 113
# ~5 j+ y V W6 s R. n3.4.3 SSH无钥登录 113# o8 v G% h w$ {* x8 K0 X
3.4.4 安装、配置Hadoop环境变量 115
5 m/ z6 r$ s: O3.5 大数据处理系统分类 118( T% G0 x' E( E0 j
3.5.1 批量数据处理系统 118& K# D0 W$ J0 X2 t. A
3.5.2 流式数据处理系统 119
) Z: I2 ] W) A: A& L, J% k3.5.3 交互式数据处理 122) A( l& S+ Z- y$ ~
3.5.4 图数据处理系统 124
: F0 C% O" A' {; L8 K3.6 大数据查询和分析技术:SQL on Hadoop 1263 Y4 A! k, j9 u5 e) d3 E' }
3.6.1 数据库简介 1266 k5 ]) E0 H U6 k2 X3 M, N) }- V
3.6.2 图数据库 128
! p- r) R" x. |2 H7 z3.6.3 Hive:基本的Hadoop分析 1306 d" H+ B0 U# m, e5 D( E0 S: H
3.6.4 实时互动的SQL:Impala和Drill 134! q% T# d+ E3 f4 m- K6 G; w6 g
3.7 以通信业务分析为例的大数据的技术环境部署 136; [3 x+ |1 b1 F5 C) e/ r
3.7.1 应用架构规划与设计 136
7 p. a a! O/ s" ]0 \2 L3.7.2 技术环境部署与配置 137
5 P3 G) N' o# T' I第4章 大数据应用的总体架构和关键技术 148
: j' E9 }* f' r6 p( S# D k" I: v) z4.1 大数据的业务分析 148$ I) o3 a" M& z: F) V7 ^% {6 m
4.2 大数据的总架体构模型 152
/ h4 ^" N. T2 W8 G% B# ]7 f& v4.3 大数据高级分析 161' E2 m* Q! s* F
4.3.1 数据仓库与联机分析处理技术 162
9 _) X$ l, @* k( q4.3.2 大数据分析与传统分析 167
/ P E/ K+ d O8 c4 i4.3.3 非结构化复杂数据分析 168% \' P: F0 N1 r# _! l( }5 Y
4.3.4 实时预测分析 177
% D% T$ S/ s! x* }5 ^7 f. E I3 Y0 j4.4 可视化分析 181
+ T( T7 u8 p+ u3 n2 @) W4.4.1 可视化技术 181 4.4.2 可视化工具 192. K2 G p7 h3 c; _9 B
参考文献 195/ r. ^. t# q; C4 u; E
第5章 运营商数据分析 196
; r) V1 r5 B6 L, |0 D" X/ F: W9 \5.1 案例背景 196- S$ H9 N' V; i" @
5.1.1 大数据运营已为大势所趋 1967 v% m0 V6 p% f3 [
5.1.2 采取大数据运营的原因 196" ]) n) y$ s) D! v: j
5.1.3 大数据分析如何提升电信行业绩效 197
# t1 U. H6 m5 J, M e/ o& f5.1.4 大数据的社会价值 199, E: q$ r7 |* R& N& W. d( j
5.2 挖掘目标的提出 200
, d2 |5 G$ c" o0 s3 U4 J7 h x5 B. d5.3 案例分析 201
1 y! D* [" {' N5.3.1 体系架构 201
, m X8 k* F( a8 D- T5.3.2 Hadoop集群抽取模块 202
3 h6 D3 X, _! t. h: f5.3.3 数据处理模块 208
' T, @. y9 G! j- ]+ r5.3.4 数据分发 211 }. x3 O. p) {) z" S8 g
5.4 MapReduce操作 218
8 V/ T% r7 V' d- v; ?- [5.5 结果分析 221
- s7 c% T7 M }0 G, Q" W! D9 F Q第6章 互联网电影推荐系统 223* p* x% X) ^0 j
6.1 背景描述 2230 ~& T; i% \; q" i1 c6 d7 j/ j! l
6.2 业务目标 224- A3 U; d' h- [, h) d. s2 T2 b& r
6.3 业务需求 225
; P; B/ ^' K# A+ k6.4 协同过滤推荐系统建模 225 `" c5 K" h* K0 f
6.4.1 推荐系统概述 225, l O- _, W; d$ Z( W9 M$ [6 G* F, C
6.4.2 基于对立用户的协同过滤模型 227/ V4 I; o4 `, X7 e
6.5 项目处理过程 229
( _2 t" q# c4 L6 F) h6.5.1 项目数据 229* A" l4 h9 f/ C! b6 g* E
6.5.2 数据预处理 2305 j4 K6 K G$ {5 e- h0 @
6.5.3 Hadoop并行算法 242
3 M1 q v, u1 c8 E6.6 总结 250
1 }/ _8 s) M4 KJava资料百度网盘下载地址链接(百度云):java自学网(javazx.com) 大数据之美:挖掘、Hadoop、架构,更精准地发现业务与营销 PDF 高清 电子书 百度云.rar【密码回帖可见】
7 ^, U0 x ~* _& Z. P* h+ h
- y- n0 s: w3 ^7 Q% {
+ i! p9 ]- B. m9 O" G5 `$ }' ^
/ I: }5 J9 w( m7 C
9 q% n. w9 `0 |; r# Q4 m/ a+ h1 q |