大數(shù)據(jù)處理技術(shù)-基于Hadoop/Yarn的實(shí)戰(zhàn)(含Spark、Storm和Docker應(yīng)用介紹 )
本課程從大數(shù)據(jù)技術(shù)以及Hadoop/Yarn實(shí)戰(zhàn)的角度,結(jié)合理論和實(shí)踐,全方位地介紹Hadoop/Yarn這一高性能處理大數(shù)據(jù)工具的開發(fā)技巧。本課程涉及的主題包括:Hadoop/Yarn分布式文件系統(tǒng)DFS;MapReduce的的工作機(jī)制、類型和格式;如何構(gòu)建和管理Hadoop/Yarn集群;Pig Latin語言的使用技巧;Hive數(shù)據(jù)倉庫工具介紹;HBase和Zookeeper工具的使用和管理;開源數(shù)據(jù)采集工具sqoop。