大雀软件园

首页 软件下载 安卓市场 苹果市场 电脑游戏 安卓游戏 文章资讯 驱动下载
技术开发 网页设计 图形图象 数据库 网络媒体 网络安全 站长CLUB 操作系统 媒体动画 安卓相关
当前位置: 首页 -> 教育教学 -> 电子书籍 -> spark快速大数据分析-[美]卡劳等著pdf高清扫描版
spark快速大数据分析-[美]卡劳等著pdf高清扫描版

spark快速大数据分析-[美]卡劳等著pdf高清扫描版

免费软件
  • 软件大小:15.8MB
  • 软件语言:简体中文
  • 更新时间: 2021-12-21
  • 软件类型:国产软件
  • 运行环境:win系统
  • 软件等级 :
大雀下载地址
banner1
  • 介绍说明
  • 下载地址
  • 相关推荐
spark快速大数据分析2015年9月由人民邮电出版社出版发行,是一本非常经典的spark快速大数据分析方面的学习书籍。近年来大数据逐渐升温,我们呢处在一个数据爆炸的时代大量涌现的智能手机,平板等等设备每时每刻都在产生新的数据。小编推荐的这本Spark快速大数据分析由Spark开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用Spark收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。感兴趣的朋友欢迎免费下载并阅读。
spark快速大数据分析-[美]卡劳等著pdf高清扫描版 (图1)

作者简介:

Holden Karau,是Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。
Andy Konwinski,是Databricks联合创始人,Apache Spark项目技术专家,还是Apache Mesos项目的联合发起人。
Patrick Wendell,是Databricks联合创始人,也是Apache Spark项目技术专家。他还负责维护Spark核心引擎的几个子系统。
Matei Zaharia,是Databricks的CTO,同时也是Apache Spark项目发起人以及Apache基金会副主席。

免责声明:

来源于网络,仅用于分享知识,学习和交流!请下载完在24小时内删除。
禁用于商业用途!如果您喜欢《spark快速大数据分析》,请购买正版,谢谢合作。
爱学习,请到3322软件站查找资源自行下载!

spark快速大数据分析目录:

推荐序  xi
译者序  xiv
序  xvi
前言  xvii
第1章 Spark数据分析导论  1
1.1 Spark是什么  1
1.2 一个大一统的软件栈  2
1.2.1 Spark Core  2
1.2.2 Spark SQL  3
1.2.3 Spark Streaming  3
1.2.4 MLlib  3
1.2.5 GraphX  3
1.2.6 集群管理器  4
1.3 Spark的用户和用途  4
1.3.1 数据科学任务  4
1.3.2 数据处理应用  5
1.4 Spark简史  5
1.5 Spark的版本和发布  6
1.6 Spark的存储层次  6
第2章 Spark下载与入门  7
2.1 下载Spark  7
2.2 Spark中Python和Scala的shell  9
2.3 Spark 核心概念简介  12
2.4 独立应用  14
2.4.1 初始化SparkContext  15
2.4.2 构建独立应用  16
2.5 总结  19
第3章 RDD编程  21
3.1 RDD基础  21
3.2 创建RDD  23
3.3 RDD操作  24
3.3.1 转化操作  24
3.3.2 行动操作  26
3.3.3 惰性求值  27
3.4 向Spark传递函数  27
3.4.1 Python  27
3.4.2 Scala  28
3.4.3 Java  29
3.5 常见的转化操作和行动操作  30
3.5.1 基本RDD  30
3.5.2 在不同RDD类型间转换  37
3.6 持久化( 缓存)  39
3.7 总结  40
第4章 键值对操作  41
4.1 动机  41
4.2 创建Pair RDD  42
4.3 Pair RDD的转化操作  42
4.3.1 聚合操作  45
4.3.2 数据分组  49
4.3.3 连接  50
4.3.4 数据排序  51
4.4 Pair RDD的行动操作  52
4.5 数据分区(进阶)  52
4.5.1 获取RDD的分区方式  55
4.5.2 从分区中获益的操作  56
4.5.3 影响分区方式的操作  57
4.5.4 示例:PageRank  57
4.5.5 自定义分区方式  59
4.6 总结  61
第5章 数据读取与保存  63
5.1 动机  63
5.2 文件格式  64
5.2.1 文本文件  64
5.2.2 JSON  66
5.2.3 逗号分隔值与制表符分隔值  68
5.2.4 SequenceFile  71
5.2.5 对象文件  73
5.2.6 Hadoop输入输出格式  73
5.2.7 文件压缩  77
5.3 文件系统  78
5.3.1 本地/“常规”文件系统  78
5.3.2 Amazon S3  78
5.3.3 HDFS  79
5.4 Spark SQL中的结构化数据  79
5.4.1 Apache Hive  80
5.4.2 JSON  80
5.5 阅读器下载哦
3、安装后,再打开解压得出的pdf文件
4、以上都完成后,接下来双击进行阅读就可以啦,朋友们开启你们的阅读之旅吧。
方法二:
1、可以在手机里下载3322软件站中的阅读器和百度网盘
2、接下来直接将pdf传输到百度网盘
3、用阅读器打开即可阅读
下载地址
  • PC版
  • 电信高速下载
  • 联通高速下载
  • 广东电信下载
  • 山东电信下载

默认解压密码:www.daque.cn
如需解压,请在本站下载飞压软件进行解压!

本类排名

本类推荐

Copyright © 2019-2021 大雀软件园(www.daque.cn) All Rights Reserved.

<

slide.2.1.1.js">