第二部分:深入解析HDFS
· 深度解析HDFS系统配置
HDFS及Linux中与HDFS相关的配置项详解,常用的HDFS必配项及其在实践中的设置方法
· 玩转HDFS
如何管理和维护HDFS,查找HDFS的基本命令,如何获取帮助,HDFS中的两个**常用命令集dfs和dfsadmin
· 深度解析HDFS的五大关键特性
EditLog、Checkpoint、 Rebalance、Rack Awareness和Replication
· 深度解析HDFS的读写过程和性能优化
HDFS在文件读写过程(结合HDFS源代码),HDFS的租约机制与无锁读写特性,如何从操作系统磁盘、
文件系统和网络等几个层面来优化的HDFS性能
· Trouble Shooting HDFS
HDFS的常见问题,Namenode的常见问题及其处理方法 , 元数据损坏时如何恢复,Datanode的常见问题及其处理方法
· 深入浅出Zookeeper
Paxos与Google的分布式 协同 机 制 , Chubby与Zookeeper, Zookeeper的 原 理、部署方法和应用技巧
· Hadoop Ha理论与实践
Hadoop HA的前世今生,Hadoop HA中是否存在数据丢失 的 风险 , Hadoop2中的 两 种HA方 式 QJM和 NFS, QJM方案配置演示
· HDFS RAID与HttpFS
· 案例分析:制作基于HDFS的对象存储
第三部分:深入解析MapReduce
· 深度刨析JobTracker和TaskTracker
JobTracker和TaskTracker的工作原理详解
· MapReduce经典案例刨析与开发思想
函式编程的回顾与深化,MapReduce典 型 程 序 分析:Wordcount、Top-k与Join
· 定制你的MapReduce
Inputformat、OutputFormat和Partitioner等
· 让Ma pRed uce 程序飞速运行(一)
深度解析 Split、Sort、 Shuffling、 Merge四 大MapReducce程序执行过程中所经历的四大关键过程,
如何利用这4大过程来优化MapReduce程序
· 让Ma pRed uce 程序飞速运行(二)
Combiner原理及其在MapReduce中的作用 ,MapReduce实际案例分析
· MapReduce程序开发的技巧
用Python等第三方语言**编写MapReduce程序、自动串接多个Mapper 和Reducer、
容忍一定程度的失败任务和错误记录等
· 进一步玩转MapReduce的平台级优化
MapReduce程序的主要性能瓶颈及各种“坑”,MapReduce的主要性能配置项及其配置方法
· YARN和MRv2选讲
案例分析:挖掘运营商中的大数据