?
培訓特色
本次課程將介紹數據倉庫和商業智能技術的基本理論和體系架構,通過大型數據倉庫和商業智能項目案例闡述數據倉庫和商業智能項目的實施過程和方法。通過實際應用案例介紹多維數據模型、粒度、立方體及元數據等重要概念。詳細講解構建數據倉庫和商業智能體系的核心方法和技術,并模擬搭建基本的數據倉庫和商業智能環境。熟悉主流數據倉庫和商業智能廠商及了解相關軟件產品的操作和使用。
1、培訓過程中將以大型項目案例為背景,逐步講解整個數據倉庫的設計過程和實施方法
2、課程將以深入淺出的案例讓學員輕松掌握數據倉庫相關技術?
3、課程的重點是項目實施,將深入探討數據倉庫項目的實施問題,逐一解決
目標收益
1、通過完整項目案例,客戶將學會數據倉庫設計和實施的標準方法
2、客戶將學會如何分析問題,如何快速開發本行業的數據倉庫項目
3、客戶將學會解決數據倉庫實施過程中所遇到的重點和難點問題
4、 通過動手實驗,客戶將學會微軟商業智能相關工具的操作使用
5、客戶將學習最新數據倉庫和商業智能領域的前沿技術
課程大綱
?
主題 |
內容 |
專題一:?
數據倉庫基礎知識
|
內容一:BI的架構
1、BI體系介紹
2、ETL介紹
3、多維數據庫介紹
4、前端展現介紹
5、數據挖掘介紹
內容二: SQL Server 2005 BI工具介紹
1、ETL工具---SSIS介紹
2、OLAP工具---SSAS介紹
3、報表工具---SSRS介紹
4、數據挖掘工具---SSAS中的挖掘模型
內容三、BI在行業中的應用?
1、現代企業BI需求概述?
2、互聯網行業案例分析
3、生產制造行業案例研究
4、醫藥行業案例分析
5、BI系統數據更新與維護
|
專題二:?
ETL設計部分
|
內容一、SSIS 簡介
1、控制流介紹
2、數據流介紹
3、事件處理
4、包瀏覽器
內容二、控制流任務組件詳解
1、循環容器
2、執行SQL任務
3、文件系統任務
4、執行進程任務
5、執行DTS2000包任務
6、腳本任務
7、發送郵件任務
內容三:數據流任務組件詳解
1、條件拆分
2、數據轉換
3、派生列
4、排序
5、緩慢變化維度
6、合并聯接
7、分播
8、查找和模糊查找
9、分組和模糊分組
內容四:創建SSIS包
1、創建控制流任務
2、創建數據流任務
3、使用數據源和數據源視圖
4、使用變量
5、使用約束
6、使用表達式
7、使用連接管理器
內容五:管理SSIS包
1、使用日志功能
2、使用配置文件
3、使用檢查點
4、使用安全性設置
內容六:監視和優化SSIS包
1、使用數據查看器
2、使用包瀏覽器
3、SSIS包的性能優化
|
專題三:
海量數據優化部分
|
內容一:海量數據的特點?
1、什么是海量數據?
2、海量數據的特點?
3、海量數據與行業應用
內容二:16種海量數據優化方法詳解?
1、海量數據分區處理?
2、使用中間表和臨時表?
3、分批次處理?
4、建立廣泛的索引?
5、建立緩存機制?
6、使用文本和二進制格式進行處理?
7、定制強大的清洗規則和出錯處理機制?
8、建立視圖或者物化視圖?
9、其他優化方法?
內容三:數據倉庫中海量數據的處理方式?
1、數據倉庫中的海量數據特點?
2、數據倉庫中的海量數據的處理方式?
3、分布式數據倉庫的特點及應用?
內容四:海量數據高級應用?
1、大型項目中海量數據的優化案例分析?
2、使用海量數據優化工具?
3、數據倉庫的性能調優技巧
|
專題四:?
數據倉庫項目案例分析
|
內容一:Novartis大型數據倉庫項目?
1、項目介紹?
2、復雜多系統多數據源的特點?
3、ODS的使用?
4、整體項目架構設計?
5、ETL流程設計?
6、緩慢變化維度的使用?
7、MDM的使用與元數據管理?
8、抽取策略的制定
9、數據倉庫更新技巧
內容二:Search Funnel數據倉庫設計?
1、項目介紹?
2、項目中的海量數據?
3、ETL流程中的程序設計?
4、如何設計抽取策略?
內容三:AdventureWorks數據倉庫流程詳解?
1、案例介紹?
2、ETL流程詳解?
3、SSAS流程詳解?
4、SSRS流程詳解
|
專題五:?
構建多維數據庫
|
內容一:創建多維數據庫
1、定義數據源
2、定義數據源視圖
3、創建維度
4、創建多維數據集
5、設置量度組成員
內容二:統一維度模型(UDM)
1、定義業務實體
2、定義業務邏輯
3、定義計算成員?
內容三:MDX語言
1、MDX概念
2、MDX語法結構
3、MDX的查詢功能
4、使用MDX定制商務邏輯
5、MDX復雜案例分析
6、MDX與權限管理
內容四:OLAP的聚合方式
1、ROLAP聚合方式
2、MOLAP聚合方式
3、HOLAP聚合方式
內容五:SSAS高級特性
1、維度層次
2、貨幣轉換
3、本地化
4、使用文件夾
5、透視
6、使用Action
7、關鍵性能指標(KPI)
|
專題六:?
前端報表展現分析
|
內容一:使用Report Model開發報表?
1、Report Model介紹?
2、創建數據源?
3、使用報表控件?
4、使用參數?
5、使用級連報表
內容二:使用Report Builder開發報表?
1、Report Builder介紹?
2、創建數據源?
3、使用向導?
4、使用參數?
內容三:使用二維表數據源設計報表
1、數據源的特點
2、設計報表
3、根據數據源更新報表
內容四:報表管理?
1、權限管理?
2、角色定義?
3、報表配置?
內容五:報表分發和定制?
1、報表分發?
2、報表定制?
內容六:使用ProClarity開發報表?
1、ProClarity功能介紹
2、使用ProClarity開發報表?
3、ProClarity報表管理
|
專題七:?
數據挖掘相關技術
|
內容一:SQL Server 2005中九種新型數據挖掘算法模型?
1、 九種挖掘算法模型應用的背景?
2、 決策樹算法與模型設計?
3、 聚類算法與模型設計?
4、 關聯規則算法與模型設計?
5、 貝葉斯算法與模型設計?
6、 時間序列算法與模型設計?
7、 其他挖掘算法與模型設計?
內容二:常用挖掘模型詳解?
1、決策樹算法詳解及工具實現?
2、聚類算法詳解及工具實現?
3、關聯規則算法詳解及工具實現?
4、貝葉斯算法詳解及工具實現?
5、時間序列算法詳解及工具實現?
6、數據挖掘模型評估
內容三:DMX語言?
1、DMX語法結構?
2、使用DMX將挖掘結果導出?
3、使用DMX進行參數設置?
內容四:挖掘模型與SSIS的整合?
1、數據挖掘查詢任務?
2、數據挖掘模型訓練任務?
3、SSAS處理任務中的挖掘模型處理
內容五:基于挖掘模型的二次開發?
1、CS結構的開發
2、BS結構的開發
|