Spark与Hadoop大数据分析 (大数据技术丛书)

Spark与Hadoop大数据分析 (大数据技术丛书)

作者
文卡特·安卡姆(Venkat Ankam)、吴今朝
语言
简体中文
电子书格式
epub,pdf,mobi,azw3,txt,fb2,djvu
下载次数
5884
更新日期
2023-08-19
运行环境
PC/Windows/Linux/Mac/IOS/iPhone/iPad/iBooks/Kindle/Android/安卓/平板
内容简介

本书讲解了Apache Spark和Hadoop的基础知识,以及如何通过简单的方式将它们与最常用的工具和技术集成在一起。所有Spark组件(Spark Core、Spark SQL、DataFrame、Dataset、Conventional Streaming、Structured Streaming、MLlib、GraphX和Hadoop核心组件)、HDFS、MapReduce和Yarn都在Spark+Hadoop集群的实现示例中进行了深入的探讨。大数据分析行业正在从MapReduce转向Spark。因此,本书深入讨论了Spark相比MapReduce的优势,从而揭示出它在内存计算速度方面的好处。我们还会讲解如何运用DataFrame API、Data Sources API,以及新的Dataset API来构建大数据分析应用程序。书中还讲解了如何使用Spark Streaming配合Apache Kafka和HBase进行实时数据分析,以帮助构建流式应用程序(streaming application)。新的结构化流(Structured Streaming)概念会通过物联网(Internet of Things,IOT)用例来解释。在本书中,机器学习技术会使用MLLib、机器学习流水线和SparkR来实现;图分析则会利用Spark的GraphX和GraphFrames组件包来进行。

Spark与Hadoop大数据分析 (大数据技术丛书) EPUB, PDF, MOBI, AZW3, TXT, FB2, DjVu, Kindle电子书免费下载。

《Spark与Hadoop大数据分析 (大数据技术丛书)》电子书免费下载

epub下载 pdf下载 mobi下载 azw3下载 txt下载 fb2下载 djvu下载

猜你喜欢