課程簡介
本次課程將介紹數(shù)據(jù)分析、數(shù)據(jù)倉庫、商業(yè)智能和數(shù)據(jù)挖掘等技術(shù)的基本理論和體系架構(gòu),通過大型數(shù)據(jù)倉庫和數(shù)據(jù)挖掘項目案例闡述數(shù)據(jù)倉庫和數(shù)據(jù)挖掘項目的實施過程和方法。通過實際應(yīng)用案例介紹多維數(shù)據(jù)模型、粒度、立方體及元數(shù)據(jù)等重要概念。詳細講解構(gòu)建數(shù)據(jù)倉庫和數(shù)據(jù)挖掘體系的核心方法和技術(shù),并結(jié)合實際項目搭建數(shù)據(jù)倉庫和數(shù)據(jù)挖掘環(huán)境。掌握主流數(shù)據(jù)倉庫和數(shù)據(jù)挖掘廠商及相關(guān)軟件產(chǎn)品的操作和使用。
目標收益
培訓(xùn)對象
課程大綱
專題一: BI基礎(chǔ)知識 |
簡述: 介紹數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基本概念,BI體系架構(gòu), BI工具介紹及其應(yīng)用,針對行業(yè)提供行業(yè)解決方案和案例分析。 內(nèi)容一:數(shù)據(jù)倉庫基本概念 1、數(shù)據(jù)倉庫的來源及定義 2、數(shù)據(jù)倉庫的應(yīng)用領(lǐng)域 3、數(shù)據(jù)挖掘的來源及定義 4、數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域 內(nèi)容二:BI的架構(gòu) 1、BI體系介紹 2、數(shù)據(jù)倉庫介紹 3、ETL介紹 4、多維數(shù)據(jù)庫介紹 5、前端展現(xiàn)介紹 6、數(shù)據(jù)挖掘模型介紹 內(nèi)容三:BI工具介紹 1、ETL工具---SSIS介紹 2、OLAP工具---SSAS介紹 3、報表工具---SSRS介紹 4、數(shù)據(jù)挖掘工具---SSAS中的挖掘模型 內(nèi)容四、BI在行業(yè)中的應(yīng)用 1、現(xiàn)代企業(yè)BI需求概述 2、電力行業(yè)案例分析 3、生產(chǎn)制造行業(yè)案例研究 4、醫(yī)藥行業(yè)案例分析 5、BI系統(tǒng)數(shù)據(jù)更新與維護 |
專題二: 數(shù)據(jù)倉庫架構(gòu)設(shè)計與完整流程詳解 |
簡述:介紹數(shù)據(jù)倉庫設(shè)計的基本原則和數(shù)據(jù)倉庫的架構(gòu)設(shè)計方式,以及構(gòu)建數(shù)據(jù)倉庫的核心步驟,提供ETL,OLAP,報表等整體解決方案和設(shè)計方法。 內(nèi)容一、數(shù)據(jù)倉庫設(shè)計 1、數(shù)據(jù)倉庫設(shè)計原則與模型搭建 2、星型架構(gòu)與雪花型架構(gòu) 3、事實表與維度表的設(shè)計 4、邏輯設(shè)計與物理設(shè)計 5、數(shù)據(jù)倉庫設(shè)計的常用方法 6、數(shù)據(jù)倉庫設(shè)計技巧總結(jié) 7、數(shù)據(jù)倉庫案例分析 內(nèi)容二、ETL 1、數(shù)據(jù)集成方法 2、數(shù)據(jù)抽取 3、數(shù)據(jù)轉(zhuǎn)換 4、數(shù)據(jù)加載 5、ETL調(diào)度策略 6、緩慢變化維度和時間戳的處理 7、ETL高級技巧 8、ETL案例分析 內(nèi)容三:OLAP模型設(shè)計 1、OLAP的應(yīng)用場合 2、OLAP模型搭建 3、統(tǒng)一維度模型UDM 4、確定維度、量度與事實的關(guān)系 5、使用計算成員 6、使用KPI 7、OLAP中的高級應(yīng)用 內(nèi)容四:前端展現(xiàn)分析 1、多維分析報表 2、報表設(shè)計 3、報表開發(fā) 4、報表分發(fā)和定制 5、報表權(quán)限管理 6、報表集成 |
專題三: 數(shù)據(jù)挖掘架構(gòu)設(shè)計與完整流程詳解 |
簡述: 九種數(shù)據(jù)挖掘算法與模型詳解,數(shù)據(jù)挖掘的設(shè)計與實施流程,數(shù)據(jù)挖掘查詢語言的使用等,重點對決策樹算法、關(guān)聯(lián)規(guī)則算法、聚類算法等給出詳細設(shè)計和處理流程。 內(nèi)容一:九種數(shù)據(jù)挖掘算法 1、 九種挖掘算法應(yīng)用的背景 2、 決策樹算法與模型設(shè)計 3、 聚類算法與模型設(shè)計 4、 關(guān)聯(lián)規(guī)則算法與模型設(shè)計 5、 貝葉斯算法與模型設(shè)計 6、 時間序列算法與模型設(shè)計 7、 其他挖掘算法與模型設(shè)計 內(nèi)容二:常用挖掘模型詳解 1、決策樹算法詳解及工具實現(xiàn) 2、聚類算法詳解及工具實現(xiàn) 3、關(guān)聯(lián)規(guī)則算法詳解及工具實現(xiàn) 4、貝葉斯算法詳解及工具實現(xiàn) 5、時間序列算法詳解及工具實現(xiàn) 6、數(shù)據(jù)挖掘模型評估 內(nèi)容三:數(shù)據(jù)挖掘的流程 1、數(shù)據(jù)清洗準備 2、數(shù)據(jù)預(yù)處理 3、選擇數(shù)據(jù)挖掘模型 4、數(shù)據(jù)挖掘模型訓(xùn)練 5、更新算法模型 6、模型評估 7、部署與應(yīng)用 內(nèi)容四:DMX語言 1、DMX語法結(jié)構(gòu) 2、使用DMX創(chuàng)建挖掘模型 3、使用DMX將挖掘結(jié)果導(dǎo)出 4、使用DMX進行挖掘模型參數(shù)設(shè)置 |
專題四: 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目案例分析 |
簡述: 大型數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目設(shè)計和實施,重點對項目架構(gòu)設(shè)計和數(shù)據(jù)完整處理流程做重點分析和詳細介紹,針對大型數(shù)據(jù)倉庫項目,提供了完備的異構(gòu)數(shù)據(jù)源集成方案,以及ODS和緩慢變化維度等的應(yīng)用技巧,針對數(shù)據(jù)挖掘項目給出完整設(shè)計思路和數(shù)據(jù)處理技術(shù)應(yīng)用。 內(nèi)容一:Novartis大型數(shù)據(jù)倉庫項目 1、項目介紹 2、復(fù)雜多系統(tǒng)多數(shù)據(jù)源的特點 3、ODS的使用 4、整體項目架構(gòu)設(shè)計 5、ETL流程設(shè)計 6、緩慢變化維度的使用 7、抽取策略的制定 8、OLAP與報表的設(shè)計和使用 9、數(shù)據(jù)倉庫更新技巧 內(nèi)容二:MSN數(shù)據(jù)挖掘項目 1、項目介紹 2、項目中的海量數(shù)據(jù) 3、數(shù)據(jù)挖掘算法 4、數(shù)據(jù)挖掘模型構(gòu)建 5、數(shù)據(jù)的預(yù)處理技術(shù) 6、對挖掘模型進行訓(xùn)練 7、展示數(shù)據(jù)挖掘模型結(jié)果 8、數(shù)據(jù)挖掘模型評估 內(nèi)容三:AdventureWorks整體項目案例 1、案例介紹 2、ETL流程詳解 3、OLAP流程詳解 4、前端報表流程詳解 5、數(shù)據(jù)挖掘流程詳解 |
專題一: BI基礎(chǔ)知識 簡述: 介紹數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基本概念,BI體系架構(gòu), BI工具介紹及其應(yīng)用,針對行業(yè)提供行業(yè)解決方案和案例分析。 內(nèi)容一:數(shù)據(jù)倉庫基本概念 1、數(shù)據(jù)倉庫的來源及定義 2、數(shù)據(jù)倉庫的應(yīng)用領(lǐng)域 3、數(shù)據(jù)挖掘的來源及定義 4、數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域 內(nèi)容二:BI的架構(gòu) 1、BI體系介紹 2、數(shù)據(jù)倉庫介紹 3、ETL介紹 4、多維數(shù)據(jù)庫介紹 5、前端展現(xiàn)介紹 6、數(shù)據(jù)挖掘模型介紹 內(nèi)容三:BI工具介紹 1、ETL工具---SSIS介紹 2、OLAP工具---SSAS介紹 3、報表工具---SSRS介紹 4、數(shù)據(jù)挖掘工具---SSAS中的挖掘模型 內(nèi)容四、BI在行業(yè)中的應(yīng)用 1、現(xiàn)代企業(yè)BI需求概述 2、電力行業(yè)案例分析 3、生產(chǎn)制造行業(yè)案例研究 4、醫(yī)藥行業(yè)案例分析 5、BI系統(tǒng)數(shù)據(jù)更新與維護 |
專題二: 數(shù)據(jù)倉庫架構(gòu)設(shè)計與完整流程詳解 簡述:介紹數(shù)據(jù)倉庫設(shè)計的基本原則和數(shù)據(jù)倉庫的架構(gòu)設(shè)計方式,以及構(gòu)建數(shù)據(jù)倉庫的核心步驟,提供ETL,OLAP,報表等整體解決方案和設(shè)計方法。 內(nèi)容一、數(shù)據(jù)倉庫設(shè)計 1、數(shù)據(jù)倉庫設(shè)計原則與模型搭建 2、星型架構(gòu)與雪花型架構(gòu) 3、事實表與維度表的設(shè)計 4、邏輯設(shè)計與物理設(shè)計 5、數(shù)據(jù)倉庫設(shè)計的常用方法 6、數(shù)據(jù)倉庫設(shè)計技巧總結(jié) 7、數(shù)據(jù)倉庫案例分析 內(nèi)容二、ETL 1、數(shù)據(jù)集成方法 2、數(shù)據(jù)抽取 3、數(shù)據(jù)轉(zhuǎn)換 4、數(shù)據(jù)加載 5、ETL調(diào)度策略 6、緩慢變化維度和時間戳的處理 7、ETL高級技巧 8、ETL案例分析 內(nèi)容三:OLAP模型設(shè)計 1、OLAP的應(yīng)用場合 2、OLAP模型搭建 3、統(tǒng)一維度模型UDM 4、確定維度、量度與事實的關(guān)系 5、使用計算成員 6、使用KPI 7、OLAP中的高級應(yīng)用 內(nèi)容四:前端展現(xiàn)分析 1、多維分析報表 2、報表設(shè)計 3、報表開發(fā) 4、報表分發(fā)和定制 5、報表權(quán)限管理 6、報表集成 |
專題三: 數(shù)據(jù)挖掘架構(gòu)設(shè)計與完整流程詳解 簡述: 九種數(shù)據(jù)挖掘算法與模型詳解,數(shù)據(jù)挖掘的設(shè)計與實施流程,數(shù)據(jù)挖掘查詢語言的使用等,重點對決策樹算法、關(guān)聯(lián)規(guī)則算法、聚類算法等給出詳細設(shè)計和處理流程。 內(nèi)容一:九種數(shù)據(jù)挖掘算法 1、 九種挖掘算法應(yīng)用的背景 2、 決策樹算法與模型設(shè)計 3、 聚類算法與模型設(shè)計 4、 關(guān)聯(lián)規(guī)則算法與模型設(shè)計 5、 貝葉斯算法與模型設(shè)計 6、 時間序列算法與模型設(shè)計 7、 其他挖掘算法與模型設(shè)計 內(nèi)容二:常用挖掘模型詳解 1、決策樹算法詳解及工具實現(xiàn) 2、聚類算法詳解及工具實現(xiàn) 3、關(guān)聯(lián)規(guī)則算法詳解及工具實現(xiàn) 4、貝葉斯算法詳解及工具實現(xiàn) 5、時間序列算法詳解及工具實現(xiàn) 6、數(shù)據(jù)挖掘模型評估 內(nèi)容三:數(shù)據(jù)挖掘的流程 1、數(shù)據(jù)清洗準備 2、數(shù)據(jù)預(yù)處理 3、選擇數(shù)據(jù)挖掘模型 4、數(shù)據(jù)挖掘模型訓(xùn)練 5、更新算法模型 6、模型評估 7、部署與應(yīng)用 內(nèi)容四:DMX語言 1、DMX語法結(jié)構(gòu) 2、使用DMX創(chuàng)建挖掘模型 3、使用DMX將挖掘結(jié)果導(dǎo)出 4、使用DMX進行挖掘模型參數(shù)設(shè)置 |
專題四: 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目案例分析 簡述: 大型數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目設(shè)計和實施,重點對項目架構(gòu)設(shè)計和數(shù)據(jù)完整處理流程做重點分析和詳細介紹,針對大型數(shù)據(jù)倉庫項目,提供了完備的異構(gòu)數(shù)據(jù)源集成方案,以及ODS和緩慢變化維度等的應(yīng)用技巧,針對數(shù)據(jù)挖掘項目給出完整設(shè)計思路和數(shù)據(jù)處理技術(shù)應(yīng)用。 內(nèi)容一:Novartis大型數(shù)據(jù)倉庫項目 1、項目介紹 2、復(fù)雜多系統(tǒng)多數(shù)據(jù)源的特點 3、ODS的使用 4、整體項目架構(gòu)設(shè)計 5、ETL流程設(shè)計 6、緩慢變化維度的使用 7、抽取策略的制定 8、OLAP與報表的設(shè)計和使用 9、數(shù)據(jù)倉庫更新技巧 內(nèi)容二:MSN數(shù)據(jù)挖掘項目 1、項目介紹 2、項目中的海量數(shù)據(jù) 3、數(shù)據(jù)挖掘算法 4、數(shù)據(jù)挖掘模型構(gòu)建 5、數(shù)據(jù)的預(yù)處理技術(shù) 6、對挖掘模型進行訓(xùn)練 7、展示數(shù)據(jù)挖掘模型結(jié)果 8、數(shù)據(jù)挖掘模型評估 內(nèi)容三:AdventureWorks整體項目案例 1、案例介紹 2、ETL流程詳解 3、OLAP流程詳解 4、前端報表流程詳解 5、數(shù)據(jù)挖掘流程詳解 |