架構(gòu)師
互聯(lián)網(wǎng)
數(shù)據(jù)挖掘
商業(yè)智能
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

數(shù)據(jù)分析與數(shù)據(jù)挖掘最佳實踐

戴輝

微軟 產(chǎn)品經(jīng)理

曾任微軟AdCenter商業(yè)智能產(chǎn)品經(jīng)理,微軟中國MSDN和TechNet的ETL版塊的研發(fā)分享工作,企業(yè)級的數(shù)據(jù)倉庫架構(gòu);建模;ETCL過程:包括數(shù)據(jù)的清洗,抽取,轉(zhuǎn)換,加載等技術(shù),對ETCL有比較深刻的了解和設(shè)計思想;搭建OLAP;前端展現(xiàn)和數(shù)據(jù)挖掘;數(shù)據(jù)整合與集成;海量數(shù)據(jù)處理,多次處理開發(fā)基于海量數(shù)據(jù)的項目。精通工具為:J2EE架構(gòu),.NET架構(gòu),Oracle,OWB,Informatica, SQL Server 2000及SQL Server 2005數(shù)據(jù)倉庫相關(guān)工具,熟悉主流BI開發(fā)工具,Reporting Servers, ProClarity, Brio, BO等前端展現(xiàn)工具等。

曾任微軟AdCenter商業(yè)智能產(chǎn)品經(jīng)理,微軟中國MSDN和TechNet的ETL版塊的研發(fā)分享工作,企業(yè)級的數(shù)據(jù)倉庫架構(gòu);建模;ETCL過程:包括數(shù)據(jù)的清洗,抽取,轉(zhuǎn)換,加載等技術(shù),對ETCL有比較深刻的了解和設(shè)計思想;搭建OLAP;前端展現(xiàn)和數(shù)據(jù)挖掘;數(shù)據(jù)整合與集成;海量數(shù)據(jù)處理,多次處理開發(fā)基于海量數(shù)據(jù)的項目。精通工具為:J2EE架構(gòu),.NET架構(gòu),Oracle,OWB,Informatica, SQL Server 2000及SQL Server 2005數(shù)據(jù)倉庫相關(guān)工具,熟悉主流BI開發(fā)工具,Reporting Servers, ProClarity, Brio, BO等前端展現(xiàn)工具等。

課程費用

6800.00 /人

課程時長

2

成為教練

課程簡介

本次課程將介紹數(shù)據(jù)分析、數(shù)據(jù)倉庫、商業(yè)智能和數(shù)據(jù)挖掘等技術(shù)的基本理論和體系架構(gòu),通過大型數(shù)據(jù)倉庫和數(shù)據(jù)挖掘項目案例闡述數(shù)據(jù)倉庫和數(shù)據(jù)挖掘項目的實施過程和方法。通過實際應(yīng)用案例介紹多維數(shù)據(jù)模型、粒度、立方體及元數(shù)據(jù)等重要概念。詳細講解構(gòu)建數(shù)據(jù)倉庫和數(shù)據(jù)挖掘體系的核心方法和技術(shù),并結(jié)合實際項目搭建數(shù)據(jù)倉庫和數(shù)據(jù)挖掘環(huán)境。掌握主流數(shù)據(jù)倉庫和數(shù)據(jù)挖掘廠商及相關(guān)軟件產(chǎn)品的操作和使用。

目標收益

培訓(xùn)對象

課程大綱

專題一:
BI基礎(chǔ)知識
簡述:
介紹數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基本概念,BI體系架構(gòu), BI工具介紹及其應(yīng)用,針對行業(yè)提供行業(yè)解決方案和案例分析。
內(nèi)容一:數(shù)據(jù)倉庫基本概念
1、數(shù)據(jù)倉庫的來源及定義
2、數(shù)據(jù)倉庫的應(yīng)用領(lǐng)域
3、數(shù)據(jù)挖掘的來源及定義
4、數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域
內(nèi)容二:BI的架構(gòu)
1、BI體系介紹
2、數(shù)據(jù)倉庫介紹
3、ETL介紹
4、多維數(shù)據(jù)庫介紹
5、前端展現(xiàn)介紹
6、數(shù)據(jù)挖掘模型介紹
內(nèi)容三:BI工具介紹
1、ETL工具---SSIS介紹
2、OLAP工具---SSAS介紹
3、報表工具---SSRS介紹
4、數(shù)據(jù)挖掘工具---SSAS中的挖掘模型
內(nèi)容四、BI在行業(yè)中的應(yīng)用
1、現(xiàn)代企業(yè)BI需求概述
2、電力行業(yè)案例分析
3、生產(chǎn)制造行業(yè)案例研究
4、醫(yī)藥行業(yè)案例分析
5、BI系統(tǒng)數(shù)據(jù)更新與維護
專題二:
數(shù)據(jù)倉庫架構(gòu)設(shè)計與完整流程詳解
簡述:介紹數(shù)據(jù)倉庫設(shè)計的基本原則和數(shù)據(jù)倉庫的架構(gòu)設(shè)計方式,以及構(gòu)建數(shù)據(jù)倉庫的核心步驟,提供ETL,OLAP,報表等整體解決方案和設(shè)計方法。
內(nèi)容一、數(shù)據(jù)倉庫設(shè)計
1、數(shù)據(jù)倉庫設(shè)計原則與模型搭建
2、星型架構(gòu)與雪花型架構(gòu)
3、事實表與維度表的設(shè)計
4、邏輯設(shè)計與物理設(shè)計
5、數(shù)據(jù)倉庫設(shè)計的常用方法
6、數(shù)據(jù)倉庫設(shè)計技巧總結(jié)
7、數(shù)據(jù)倉庫案例分析
內(nèi)容二、ETL
1、數(shù)據(jù)集成方法
2、數(shù)據(jù)抽取
3、數(shù)據(jù)轉(zhuǎn)換
4、數(shù)據(jù)加載
5、ETL調(diào)度策略
6、緩慢變化維度和時間戳的處理
7、ETL高級技巧
8、ETL案例分析
內(nèi)容三:OLAP模型設(shè)計
1、OLAP的應(yīng)用場合
2、OLAP模型搭建
3、統(tǒng)一維度模型UDM
4、確定維度、量度與事實的關(guān)系
5、使用計算成員
6、使用KPI
7、OLAP中的高級應(yīng)用
內(nèi)容四:前端展現(xiàn)分析
1、多維分析報表
2、報表設(shè)計
3、報表開發(fā)
4、報表分發(fā)和定制
5、報表權(quán)限管理
6、報表集成
專題三:
數(shù)據(jù)挖掘架構(gòu)設(shè)計與完整流程詳解
簡述:
九種數(shù)據(jù)挖掘算法與模型詳解,數(shù)據(jù)挖掘的設(shè)計與實施流程,數(shù)據(jù)挖掘查詢語言的使用等,重點對決策樹算法、關(guān)聯(lián)規(guī)則算法、聚類算法等給出詳細設(shè)計和處理流程。
內(nèi)容一:九種數(shù)據(jù)挖掘算法
1、 九種挖掘算法應(yīng)用的背景
2、 決策樹算法與模型設(shè)計
3、 聚類算法與模型設(shè)計
4、 關(guān)聯(lián)規(guī)則算法與模型設(shè)計
5、 貝葉斯算法與模型設(shè)計
6、 時間序列算法與模型設(shè)計
7、 其他挖掘算法與模型設(shè)計
內(nèi)容二:常用挖掘模型詳解
1、決策樹算法詳解及工具實現(xiàn)
2、聚類算法詳解及工具實現(xiàn)
3、關(guān)聯(lián)規(guī)則算法詳解及工具實現(xiàn)
4、貝葉斯算法詳解及工具實現(xiàn)
5、時間序列算法詳解及工具實現(xiàn)
6、數(shù)據(jù)挖掘模型評估
內(nèi)容三:數(shù)據(jù)挖掘的流程
1、數(shù)據(jù)清洗準備
2、數(shù)據(jù)預(yù)處理
3、選擇數(shù)據(jù)挖掘模型
4、數(shù)據(jù)挖掘模型訓(xùn)練
5、更新算法模型
6、模型評估
7、部署與應(yīng)用
內(nèi)容四:DMX語言
1、DMX語法結(jié)構(gòu)
2、使用DMX創(chuàng)建挖掘模型
3、使用DMX將挖掘結(jié)果導(dǎo)出
4、使用DMX進行挖掘模型參數(shù)設(shè)置
專題四:
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目案例分析
簡述:
大型數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目設(shè)計和實施,重點對項目架構(gòu)設(shè)計和數(shù)據(jù)完整處理流程做重點分析和詳細介紹,針對大型數(shù)據(jù)倉庫項目,提供了完備的異構(gòu)數(shù)據(jù)源集成方案,以及ODS和緩慢變化維度等的應(yīng)用技巧,針對數(shù)據(jù)挖掘項目給出完整設(shè)計思路和數(shù)據(jù)處理技術(shù)應(yīng)用。
內(nèi)容一:Novartis大型數(shù)據(jù)倉庫項目
1、項目介紹
2、復(fù)雜多系統(tǒng)多數(shù)據(jù)源的特點
3、ODS的使用
4、整體項目架構(gòu)設(shè)計
5、ETL流程設(shè)計
6、緩慢變化維度的使用
7、抽取策略的制定
8、OLAP與報表的設(shè)計和使用
9、數(shù)據(jù)倉庫更新技巧
內(nèi)容二:MSN數(shù)據(jù)挖掘項目
1、項目介紹
2、項目中的海量數(shù)據(jù)
3、數(shù)據(jù)挖掘算法
4、數(shù)據(jù)挖掘模型構(gòu)建
5、數(shù)據(jù)的預(yù)處理技術(shù)
6、對挖掘模型進行訓(xùn)練
7、展示數(shù)據(jù)挖掘模型結(jié)果
8、數(shù)據(jù)挖掘模型評估
內(nèi)容三:AdventureWorks整體項目案例
1、案例介紹
2、ETL流程詳解
3、OLAP流程詳解
4、前端報表流程詳解
5、數(shù)據(jù)挖掘流程詳解
專題一:
BI基礎(chǔ)知識
簡述:
介紹數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基本概念,BI體系架構(gòu), BI工具介紹及其應(yīng)用,針對行業(yè)提供行業(yè)解決方案和案例分析。
內(nèi)容一:數(shù)據(jù)倉庫基本概念
1、數(shù)據(jù)倉庫的來源及定義
2、數(shù)據(jù)倉庫的應(yīng)用領(lǐng)域
3、數(shù)據(jù)挖掘的來源及定義
4、數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域
內(nèi)容二:BI的架構(gòu)
1、BI體系介紹
2、數(shù)據(jù)倉庫介紹
3、ETL介紹
4、多維數(shù)據(jù)庫介紹
5、前端展現(xiàn)介紹
6、數(shù)據(jù)挖掘模型介紹
內(nèi)容三:BI工具介紹
1、ETL工具---SSIS介紹
2、OLAP工具---SSAS介紹
3、報表工具---SSRS介紹
4、數(shù)據(jù)挖掘工具---SSAS中的挖掘模型
內(nèi)容四、BI在行業(yè)中的應(yīng)用
1、現(xiàn)代企業(yè)BI需求概述
2、電力行業(yè)案例分析
3、生產(chǎn)制造行業(yè)案例研究
4、醫(yī)藥行業(yè)案例分析
5、BI系統(tǒng)數(shù)據(jù)更新與維護
專題二:
數(shù)據(jù)倉庫架構(gòu)設(shè)計與完整流程詳解
簡述:介紹數(shù)據(jù)倉庫設(shè)計的基本原則和數(shù)據(jù)倉庫的架構(gòu)設(shè)計方式,以及構(gòu)建數(shù)據(jù)倉庫的核心步驟,提供ETL,OLAP,報表等整體解決方案和設(shè)計方法。
內(nèi)容一、數(shù)據(jù)倉庫設(shè)計
1、數(shù)據(jù)倉庫設(shè)計原則與模型搭建
2、星型架構(gòu)與雪花型架構(gòu)
3、事實表與維度表的設(shè)計
4、邏輯設(shè)計與物理設(shè)計
5、數(shù)據(jù)倉庫設(shè)計的常用方法
6、數(shù)據(jù)倉庫設(shè)計技巧總結(jié)
7、數(shù)據(jù)倉庫案例分析
內(nèi)容二、ETL
1、數(shù)據(jù)集成方法
2、數(shù)據(jù)抽取
3、數(shù)據(jù)轉(zhuǎn)換
4、數(shù)據(jù)加載
5、ETL調(diào)度策略
6、緩慢變化維度和時間戳的處理
7、ETL高級技巧
8、ETL案例分析
內(nèi)容三:OLAP模型設(shè)計
1、OLAP的應(yīng)用場合
2、OLAP模型搭建
3、統(tǒng)一維度模型UDM
4、確定維度、量度與事實的關(guān)系
5、使用計算成員
6、使用KPI
7、OLAP中的高級應(yīng)用
內(nèi)容四:前端展現(xiàn)分析
1、多維分析報表
2、報表設(shè)計
3、報表開發(fā)
4、報表分發(fā)和定制
5、報表權(quán)限管理
6、報表集成
專題三:
數(shù)據(jù)挖掘架構(gòu)設(shè)計與完整流程詳解
簡述:
九種數(shù)據(jù)挖掘算法與模型詳解,數(shù)據(jù)挖掘的設(shè)計與實施流程,數(shù)據(jù)挖掘查詢語言的使用等,重點對決策樹算法、關(guān)聯(lián)規(guī)則算法、聚類算法等給出詳細設(shè)計和處理流程。
內(nèi)容一:九種數(shù)據(jù)挖掘算法
1、 九種挖掘算法應(yīng)用的背景
2、 決策樹算法與模型設(shè)計
3、 聚類算法與模型設(shè)計
4、 關(guān)聯(lián)規(guī)則算法與模型設(shè)計
5、 貝葉斯算法與模型設(shè)計
6、 時間序列算法與模型設(shè)計
7、 其他挖掘算法與模型設(shè)計
內(nèi)容二:常用挖掘模型詳解
1、決策樹算法詳解及工具實現(xiàn)
2、聚類算法詳解及工具實現(xiàn)
3、關(guān)聯(lián)規(guī)則算法詳解及工具實現(xiàn)
4、貝葉斯算法詳解及工具實現(xiàn)
5、時間序列算法詳解及工具實現(xiàn)
6、數(shù)據(jù)挖掘模型評估
內(nèi)容三:數(shù)據(jù)挖掘的流程
1、數(shù)據(jù)清洗準備
2、數(shù)據(jù)預(yù)處理
3、選擇數(shù)據(jù)挖掘模型
4、數(shù)據(jù)挖掘模型訓(xùn)練
5、更新算法模型
6、模型評估
7、部署與應(yīng)用
內(nèi)容四:DMX語言
1、DMX語法結(jié)構(gòu)
2、使用DMX創(chuàng)建挖掘模型
3、使用DMX將挖掘結(jié)果導(dǎo)出
4、使用DMX進行挖掘模型參數(shù)設(shè)置
專題四:
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目案例分析
簡述:
大型數(shù)據(jù)倉庫與數(shù)據(jù)挖掘項目設(shè)計和實施,重點對項目架構(gòu)設(shè)計和數(shù)據(jù)完整處理流程做重點分析和詳細介紹,針對大型數(shù)據(jù)倉庫項目,提供了完備的異構(gòu)數(shù)據(jù)源集成方案,以及ODS和緩慢變化維度等的應(yīng)用技巧,針對數(shù)據(jù)挖掘項目給出完整設(shè)計思路和數(shù)據(jù)處理技術(shù)應(yīng)用。
內(nèi)容一:Novartis大型數(shù)據(jù)倉庫項目
1、項目介紹
2、復(fù)雜多系統(tǒng)多數(shù)據(jù)源的特點
3、ODS的使用
4、整體項目架構(gòu)設(shè)計
5、ETL流程設(shè)計
6、緩慢變化維度的使用
7、抽取策略的制定
8、OLAP與報表的設(shè)計和使用
9、數(shù)據(jù)倉庫更新技巧
內(nèi)容二:MSN數(shù)據(jù)挖掘項目
1、項目介紹
2、項目中的海量數(shù)據(jù)
3、數(shù)據(jù)挖掘算法
4、數(shù)據(jù)挖掘模型構(gòu)建
5、數(shù)據(jù)的預(yù)處理技術(shù)
6、對挖掘模型進行訓(xùn)練
7、展示數(shù)據(jù)挖掘模型結(jié)果
8、數(shù)據(jù)挖掘模型評估
內(nèi)容三:AdventureWorks整體項目案例
1、案例介紹
2、ETL流程詳解
3、OLAP流程詳解
4、前端報表流程詳解
5、數(shù)據(jù)挖掘流程詳解

課程費用

6800.00 /人

課程時長

2

預(yù)約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求