曙海教學優勢
本課程,秉承二十一年積累的教學品質,以項目實現為導向,面向企事業項目實際需要,老師將會與您分享設計的全流程以及工具的綜合使用經驗、技巧。課程可定制,線上/線下/上門皆可,熱線:4008699035。
曙海培訓的課程培養了大批受企業歡迎的工程師。大批企業和曙海
建立了良好的合作關系,合作企業30萬+。曙海培訓的課程在業內有著響亮的知名度。
?
本課程將分別從理論基礎知識,程序設計以及應用案例(數據挖掘和機器學習)三方面對以Hadoop為基礎的大數據知識記性介紹。
本課程采用循序漸進的課程講授方法,首先講解Hadoop和Spark系統基礎知識,概念及架構,之后講解Hadoop和Spark實戰技巧,最后詳盡地介紹Hadoop和Spark經典案例(數據挖掘和機器學習),使培訓者從概念到實戰,均會有收獲和提高。
當前,我國已經進入大數據時代,在這樣的時代背景下,以Hadoop和Spark為基礎的大數據應用也逐漸深入,正在從互聯網企業,逐漸拓展到電信,金融,政府,醫療這些傳統行業。目前Hadoop和Spark應用場景已廣泛應用于日志存儲、查詢和非結構化數據處理等大數據應用領域,隨著Hadoop和Spark技術的不斷成熟以及生態系統相關產品的完善,包括Hadoop和Spark對SQL不斷加強的支持,以及主流商業軟件廠商對Hadoop和Spark支持的不斷增強,必定會帶動Hadoop 和Spark滲透到越來越多的應用場景中。
2015年是中國大數據的應用落地年,越來越多的行業用戶開始重視并啟動大數據相關的項目。而在大數據領域的眾多技術中,最受關注的是衍生于開源平臺的Hadoop 和Spark生態系統。Hadoop 從2006 年誕生至今已經超10年時間。2015 年,整個生態系統變得比以往更加豐富,無論是在開源領域,商業軟件廠商或是硬件廠商,都開始推出基于Hadoop 的相關產品。Hadoop之所以受到如此的關注,主要原因在于它支持用戶在低價的通用硬件平臺上實現對大數據集的處理
本課程將為大家全面而又深入的介紹Hadoop和Spark平臺的構建流程,涉及Hadoop和Spark系統基礎知識,概念及架構, Hadoop和Spark實戰技巧(數據挖掘和機器學習),Hadoop和Spark經典案例等。
通過本課程實踐,幫助學員對Hadoop生態系統有一個清晰明了的認識;理解Hadoop系統適用的場景;掌握Hadoop等初 中級應用開發技能;搭建穩定可靠的Hadoop集群,滿足生產環境的標準;掌握如何應用hadoop和spark完成數據挖掘和機器學習任務;了解和清楚大數據應用的幾個行業中的經典案例。
各類 IT/軟件企業和研發機構的軟件架構師、軟件設計師、程序員。對于懷有設計疑問和問題,需要梳理解答的團隊和個人,效果最佳。
學員學習本課程應具備下列基礎知識: 1) 了解Java語言; 2) 了解Linux系統;
3) 數據挖掘基礎
?
主題 | 內容 |
大數據架構概述 |
1. 大數據層級結構 |
數據收集系統Flume與Sqoop |
介紹如何使用flume和sqoop兩個系統將外部流式數據(比如網站日志,用戶行為數據等)、關系型數據庫(比如MySQL、Oracle等)中的數據導入Hadoop中進行分析和挖掘 |
大數據存儲系統HDFS與HBase |
1. 1. HDFS 2.0 原理、特性與基本架構 |
分布式計算技術MapReduce與Hive |
1. 介紹計算框架MapReduce基本原理,架構及程序設計方式 |
分布式計算技術Spark |
1. 介紹計算框架Spark基本原理,架構及程序設計方式 |
數據挖掘與機器學習 |
1. 常見的數據挖掘與機器學習算法 |
應用案例1:基于Hadoop的構建數據倉庫 |
1. 數據倉庫基礎介紹 |
應用案例2:用戶畫像系統 |
1. 什么是用戶畫像系統 |
應用案例3:商品推薦系統 |
1. 什么是商品推薦系統 |
應用案例4:數據挖掘系統 |
1. 什么是數據挖掘系統 |