本书主要分析Hadoop 3.2.0的新特性和新功能,共5章。首先简单介绍Hadoop,让刚接触Hadoop的读者对它有个基本了解; 接着介绍目前使用比较多的分布式文件系统HDFS,内容涉及NameNode 的原理、HA、HDFS Federation和HDFS 3.0中新增的特性;然后从应用管理和资源调度这两个方面介绍一个通用的资源管理平台YARN;再后讨论如何在YARN平台中运行应用,比如如何将应用迁移到YARN平台,以及非Hadoop的应用是如何兼容YARN模式的。最后,书中给出了一些工作实战指南,包括如何搭建一个生产可用的Hadoop 3.0集群;如何将现有Hadoop 2.0集群升级到Hadoop 3.0,及其在升级过程中遇到的问题;如何针对Hadoop进行二次开发,并参与社区,向社区贡献代码;一个大数据平台应具备哪些必备组件等。
Hadoop 3实战指南(金山云数据平台架构师孙志伟倾力打造的Hadoop 3图书 )(图灵图书) EPUB, PDF, MOBI, AZW3, TXT, FB2, DjVu, Kindle电子书免费下载。
孙志伟 金山云数据平台架构师,专注于Hadoop生态和数据平台建设,曾就职于网易、转转等互联网公司。对大数据处理、分布式计算与数据采集有着浓厚的兴趣。一直从事Hadoop 研发与运维工作,努力钻研技术并坚持分享。有着丰富的一线研发与运维经验,是多个社区的Contributor,积极活跃于开源社区。 硕士,毕业于华北电力大学。
Hadoop 作为大数据技术最典型的基础架构组件,其迭代演进体现了整个大数据技术的重要发展方向。这本书以最新版 Hadoop 3 为切入点,深入介绍了该版本中 HDFS 和 YARN 的诸多新特性,以及平台部署升级与二次开发,是大数据开发与运维人员快速了解并在实际工作中使用 Hadoop 3 的重要图书。 黄鹏程 阿里云数据库高级产品专家 作者一直从事 Hadoop 平台研发工作,是 Hadoop领域的资深专家,共事2年,他帮助我们公司大幅度提升了大数据平台稳定性。 这本书源于企业级真实实践,覆盖了完整的Hadoop系统生态。作者通过企业级的真实案例,深入浅出剖析Hadoop平台的工程架构,让读者真正掌握Hadoop系统设计的哲学本质,从而能够在面向不同业务场景时,给出优雅的大数据解决方案,真正达到企业降本增效的目的。 本书是 Hadoop 领域实践类好书,特推荐之。 孙玄 奈学教育创始人&CEO,前58集团技术委员会主席 现代科技背景下,每个企业都有产生大数据的能力,数据规模庞大并且纷繁复杂,大家都希望从海量的数据中挖掘到价值。Hadoop 从诞生之始就肩负这样的使命,整个处理架构历经十几年的不断迭代,仍然是大部分工程师入门大数据的奠基石。本书对 Hadoop 3 底层进行剖析,给大数据入门者循序渐进的实战指导,也为已经在大数据行业的从业者进行了系统性的梳理。 陈斌 金山云研发总监