请选择 进入手机版 | 继续访问电脑版
java自学网VIP

Java自学网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

Java自学网公众号

Java自学网

Java自学网

QQ客服1

QQ客服2

查看: 12564|回复: 59

[java电子书] Spark机器学习:核心技术与实践 PDF 电子书 百度云 网盘下载

  [复制链接]
  • TA的每日心情
    开心
    2018-4-8 22:14
  • 签到天数: 1 天

    [LV.1]初学乍练

    1835

    主题

    1837

    帖子

    5517

    积分

    普通会员

    Rank: 2

    积分
    5517
    发表于 2018-7-3 20:32:00 | 显示全部楼层 |阅读模式
    java自学网(www.javazx.com)-java论坛,java电子书推荐:《 Spark机器学习:核心技术与实践》
    java电子书推荐理由:作为一名具有机器学习和统计背景的开发人员,你是否感受到了当前缓慢的“小数据”机器学习工具的限制?那么本书就是为你而写!在本书中,你将会使用Spark创建可扩展的机器学习应用,为现代的数据驱动业务提供支持。 本书从MLlib和H2O库定义的机器学习原语开始,你将学到如何使用二分类检测由CERN粒子对撞机产生的大量数据中的希格斯波色子,并使用多元分类的集成方法对日常身体活动进行分类。接下来,你将解决一个涉及航班延误预测的典型回归问题,并编写复杂的Spark流水线。你将在doc2vec算法和K-means聚类的帮助下分析Twitter数据。后,你将会使用MLlib构建不同的模式挖掘模型,使用Spark和Spark SQL对DataFrame进行复杂的操作,并在Spark Streaming环境中部署你的应用。

    作者:亚历克斯特列斯
    出版社:机械工业出版社
    出版时间:2018-06-05
    书籍价格:54.50元




    java电子书目录:
    第1章 大规模机器学习和Spark入门 1
    1.1 数据科学 2
    1.2 数据科学家:21世纪最炫酷的职业 2
    1.2.1 数据科学家的一天 3
    1.2.2 大数据处理 4
    1.2.3 分布式环境下的机器学习算法 4
    1.2.4 将数据拆分到多台机器 6
    1.2.5 从Hadoop MapReduce到Spark 6
    1.2.6 什么是Databricks 7
    1.2.7 Spark包含的内容 8
    1.3 H2O.ai简介 8
    1.4 H2O和Spark MLlib的区别 10
    1.5 数据整理 10
    1.6 数据科学:一个迭代过程 11
    1.7 小结 11
    第2章 探索暗物质:希格斯玻色子 12
    2.1 Ⅰ型错误与Ⅱ型错误 12
    2.1.1 寻找希格斯玻色子 13
    2.1.2 LHC和数据的创建 13
    2.1.3 希格斯玻色子背后的理论 14
    2.1.4 测量希格斯玻色子 14
    2.1.5 数据集 14
    2.2 启动Spark与加载数据 15
    2.2.1 标记点向量 22
    2.2.2 创建训练和测试集合 24
    2.2.3 第一个模型:决策树 26
    2.2.4 下一个模型:集合树 32
    2.2.5 最后一个模型:H2O深度学习 37
    2.2.6 构建一个3层DNN 39
    2.3 小结 45
    第3章 多元分类的集成方法 46
    3.1 数据 47
    3.2 模型目标 48
    3.2.1 挑战 48
    3.2.2 机器学习工作流程 48
    3.2.3 使用随机森林建模 61
    3.3 小结 78
    第4章 使用NLP和Spark Streaming预测电影评论 80
    4.1 NLP简介 81
    4.2 数据集 82
    4.3 特征提取 85
    4.3.1 特征提取方法:词袋模型 85
    4.3.2 文本标记 86
    4.4 特征化——特征哈希 89
    4.5 我们来做一些模型训练吧 92
    4.5.1 Spark决策树模型 93
    4.5.2 Spark朴素贝叶斯模型 94
    4.5.3 Spark随机森林模型 95
    4.5.4 Spark GBM模型 96
    4.5.5 超级学习器模型 97
    4.6 超级学习器 97
    4.6.1 集合所有的转换 101
    4.6.2 使用超级学习器模型 105
    4.7 小结 105
    第5章 word2vec预测和聚类 107
    5.1 词向量的动机 108
    5.2 word2vec解释 108
    5.2.1 什么是单词向量 108
    5.2.2 CBOW模型 110
    5.2.3 skip-gram模型 111
    5.2.4 玩转词汇向量 112
    5.2.5 余弦相似性 113
    5.3 doc2vec解释 113
    5.3.1 分布式内存模型 113
    5.3.2 分布式词袋模型 114
    5.4 应用word2vec并用向量探索数据 116
    5.5 创建文档向量 118
    5.6 监督学习任务 119
    5.7 小结 123
    第6章 从点击流数据中抽取模式 125
    6.1 频繁模式挖掘 126
    6.2 使用Spark MLlib进行模式挖掘 130
    6.2.1 使用FP-growth进行频繁模式挖掘 131
    6.2.2 关联规则挖掘 136
    6.2.3 使用prefix span进行序列模式挖掘 138
    6.2.4 在MSNBC点击流数据上进行模式挖掘 141
    6.3 部署模式挖掘应用 147
    6.4 小结 154
    第7章 使用GraphX进行图分析 155
    7.1 基本的图理论 156
    7.1.1 图 156
    7.1.2 有向和无向图 156
    7.1.3 阶和度 157
    7.1.4 有向无环图 158
    7.1.5 连通分量 159
    7.1.6 树 160
    7.1.7 多重图 160
    7.1.8 属性图 161
    7.2 GraphX分布式图计算引擎 162
    7.2.1 GraphX中图的表示 163
    7.2.2 图的特性和操作 165
    7.2.3 构建和加载图 170
    7.2.4 使用Gephi可视化图结构 172
    7.2.5 图计算进阶 178
    7.2.6 GraphFrame 181
    7.3 图算法及其应用 183
    7.3.1 聚类 183
    7.3.2 顶点重要性 185
    7.4 GraphX在上下文中 188
    7.5 小结 189
    第8章 Lending Club借贷预测 190
    8.1 动机 190
    8.1.1 目标 191
    8.1.2 数据 192
    8.1.3 数据字典 192
    8.2 环境准备 193
    8.3 数据加载 193
    8.4 探索——数据分析 194
    8.4.1 基本清理 194
    8.4.2 预测目标 200
    8.4.3 使用模型评分 221
    8.4.4 模型部署 224
    8.5 小结 229

    Java资料百度网盘下载地址链接(百度云):java自学网(javazx.com) Spark机器学习:核心技术与实践  PDF 高清 电子书 百度云.rar【密码回帖可见】
    游客,如果您要查看本帖隐藏内容请->>回复




    回复

    使用道具 举报

  • TA的每日心情
    开心
    2018-7-18 11:00
  • 签到天数: 1 天

    [LV.1]初学乍练

    0

    主题

    2

    帖子

    13

    积分

    普通会员

    Rank: 2

    积分
    13
    发表于 2018-7-18 11:04:30 | 显示全部楼层
    跟着大家学习学习
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-11-28 14:41
  • 签到天数: 2 天

    [LV.1]初学乍练

    0

    主题

    4

    帖子

    29

    积分

    普通会员

    Rank: 2

    积分
    29
    发表于 2018-8-5 22:43:48 | 显示全部楼层
    好啊              
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-8-7 11:11
  • 签到天数: 1 天

    [LV.1]初学乍练

    0

    主题

    3

    帖子

    18

    积分

    普通会员

    Rank: 2

    积分
    18
    发表于 2018-8-7 11:13:52 | 显示全部楼层
    找了好久终于找到了,谢谢楼主
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-8-7 11:11
  • 签到天数: 1 天

    [LV.1]初学乍练

    0

    主题

    3

    帖子

    18

    积分

    普通会员

    Rank: 2

    积分
    18
    发表于 2018-8-7 13:22:23 | 显示全部楼层
    不错 好资料
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018-8-9 18:18
  • 签到天数: 1 天

    [LV.1]初学乍练

    0

    主题

    3

    帖子

    13

    积分

    普通会员

    Rank: 2

    积分
    13
    发表于 2018-8-9 18:19:31 | 显示全部楼层
    spark 机器学习 核心技术与实践 pdf
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2018-8-11 17:27
  • 签到天数: 2 天

    [LV.1]初学乍练

    0

    主题

    5

    帖子

    26

    积分

    普通会员

    Rank: 2

    积分
    26
    发表于 2018-8-11 17:25:20 | 显示全部楼层
    支持支持支持支持支持支持支持支持支持
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2018-8-11 18:55
  • 签到天数: 1 天

    [LV.1]初学乍练

    0

    主题

    3

    帖子

    14

    积分

    普通会员

    Rank: 2

    积分
    14
    发表于 2018-8-11 18:58:06 | 显示全部楼层
    谢谢楼主分享!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2018-8-15 12:53
  • 签到天数: 1 天

    [LV.1]初学乍练

    0

    主题

    3

    帖子

    15

    积分

    普通会员

    Rank: 2

    积分
    15
    发表于 2018-8-15 12:56:53 | 显示全部楼层
    java自学网给力 亲测资源可以
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    难过
    2019-8-5 21:41
  • 签到天数: 4 天

    [LV.2]登堂入室

    0

    主题

    101

    帖子

    249

    积分

    普通会员

    Rank: 2

    积分
    249
    发表于 2018-8-17 15:36:53 | 显示全部楼层
    Spark机器学习:Spark机器学习:Spark机器学习:Spark机器学习:Spark机器学习:
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|Java自学网 ( 京ICP备12001332号

    Powered by Javazx

    © 2018-2019 Comsenz Inc.

    快速回复 返回顶部 返回列表