本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。内容简介
大数据Hadoop 3.X分布式处理实战 EPUB, PDF, MOBI, AZW3, TXT, FB2, DjVu, Kindle电子书免费下载。
吴章勇,现任中软国际分公司技术总监,曾任阿里巴巴集团架构师,经历中山大学本科、深圳大学硕士、厦门大学博士的系统学习,软件、硬件、管理都比较擅长,并持有信息系统项目管理师、嵌入式系统设计师、高经程序员等多本软考中高级证书;创立培训公司大数据课程体系,主持开发过多个大数据项目,有15年以上开发和培训经验,精通Hadoop、Spark、Storm等大数据相关技术。作者介绍