北京站 [切換城市]
眾眾網(wǎng)全國(guó)頁(yè) 眾眾網(wǎng)北京站 數(shù)據(jù)分析師 北京CDA大數(shù)據(jù)就業(yè)班
北京CDA大數(shù)據(jù)就業(yè)班

北京CDA大數(shù)據(jù)就業(yè)班

请询价

適合對(duì)象:對(duì)大數(shù)據(jù)挖掘培訓(xùn),大數(shù)據(jù)分析培訓(xùn),大數(shù)據(jù)培訓(xùn)等有興趣學(xué)習(xí)的學(xué)員

課時(shí):800課時(shí) 班型:任意時(shí)段 班制:小班

開(kāi)設(shè)課程校區(qū):上地十街,高粱橋斜街59號(hào),廠洼街校區(qū)

課程介紹

課程亮點(diǎn):

朝九晚九全程跟班答疑、一對(duì)一督學(xué)、定期直播串講、五分鐘內(nèi)有問(wèn)必答、出勤率和進(jìn)度監(jiān)督、作業(yè)與測(cè)試

學(xué)習(xí)目標(biāo):

1.零基礎(chǔ)脫產(chǎn)學(xué)習(xí),5個(gè)月學(xué)會(huì)大數(shù)據(jù)技術(shù)

2.計(jì)算機(jī)、統(tǒng)計(jì)、數(shù)學(xué)等專(zhuān)業(yè)學(xué)習(xí)更佳

3.包學(xué)會(huì),成為大數(shù)據(jù)稀缺人才,高薪就業(yè)

4.*DA大數(shù)據(jù)就業(yè)幫,助你前程似錦

5.大數(shù)據(jù)未來(lái)已來(lái),只等你改變自己


課程內(nèi)容:

1章業(yè)務(wù)分析基礎(chǔ)技能

1-1數(shù)據(jù)分析概述

1-2常用高階函數(shù)

1-3條件格式應(yīng)用

1-4數(shù)據(jù)透視表高階應(yīng)用

1-5圖表進(jìn)階

1-6項(xiàng)目排期管理

1-7案例背景介紹

1-8動(dòng)態(tài)考勤表制作

1-9每月考勤統(tǒng)計(jì)

1-10考勤匯總統(tǒng)計(jì)

1-11常用指標(biāo)概述

1-12基礎(chǔ)指標(biāo)統(tǒng)計(jì)

1-13人力資源指標(biāo)體系概述

1-14案例背景介紹

1-15員工績(jī)效評(píng)定思路解析

1-16實(shí)操績(jī)效統(tǒng)計(jì)及可視化

1-17案例背景介紹

1-18活動(dòng)評(píng)估報(bào)表思路解析

1-19實(shí)操活動(dòng)評(píng)估指標(biāo)統(tǒng)計(jì)

1-20指導(dǎo)撰寫(xiě)報(bào)表結(jié)論

1-21圖表應(yīng)用

1-22零碎需求分析方法

1-23案例應(yīng)用-核心產(chǎn)品分析

1-24案例應(yīng)用-零售業(yè)商業(yè)智能看板

1-25RFM基礎(chǔ)模型及拓展

1-26案例應(yīng)用-用戶畫(huà)像

1-27樹(shù)狀結(jié)構(gòu)分析方法概述

1-28案例應(yīng)用-汽車(chē)行業(yè)分析報(bào)告

2章數(shù)據(jù)庫(kù)應(yīng)用技能

2-1數(shù)據(jù)庫(kù)簡(jiǎn)介

2-2表結(jié)構(gòu)的特點(diǎn)

2-3數(shù)據(jù)庫(kù)分類(lèi)

2-4MySQL簡(jiǎn)介

2-5數(shù)據(jù)庫(kù)基本結(jié)構(gòu)

2-6SQL語(yǔ)言分類(lèi)

2-7SQL書(shū)寫(xiě)要求

2-8創(chuàng)建、使用及刪除數(shù)據(jù)庫(kù)

2-9創(chuàng)建表

2-10數(shù)據(jù)類(lèi)型

2-11約束條件

2-12修改及刪除表

2-13插入數(shù)據(jù)

2-14批量導(dǎo)入數(shù)據(jù)

2-15更新數(shù)據(jù)

2-16刪除數(shù)據(jù)

2-17查詢指定列

2-18查詢不重復(fù)記錄

2-19條件查詢

2-20常用運(yùn)算符

2-21空值查詢

2-22設(shè)置別名

2-23模糊查詢

2-24查詢結(jié)果排序

2-25限制查詢

2-26聚合運(yùn)算

2-27分組查詢

2-28分組后篩選

2-29內(nèi)連接

2-30左連接

2-31右連接

2-32合并查詢

2-33標(biāo)量子查詢

2-34行子查詢

2-35列子查詢

2-36表子查詢

2-37字符串函數(shù)

2-38數(shù)學(xué)函數(shù)

2-39日期和時(shí)間函數(shù)

2-40分組合并函數(shù)

2-41邏輯函數(shù)

2-42開(kāi)窗函數(shù)

2-43進(jìn)階練習(xí)

2-44數(shù)據(jù)來(lái)源及業(yè)務(wù)背景

2-45表關(guān)系梳理

2-46數(shù)據(jù)導(dǎo)入及字段處理

2-47數(shù)據(jù)查詢

3章商業(yè)智能分析技能

3-1數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)說(shuō)明

3-2基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)處理方法

3-3數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理進(jìn)階

3-4數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用案例

3-5創(chuàng)建多維數(shù)據(jù)模型

3-6理解多維模型表連接規(guī)則

3-7業(yè)務(wù)數(shù)據(jù)分析指標(biāo)介紹

3-8業(yè)務(wù)數(shù)據(jù)匯總分析進(jìn)階

3-9時(shí)間維度分析方法說(shuō)明

3-10業(yè)務(wù)背景介紹

3-11理解及加工處理數(shù)據(jù)

3-12可視化界面創(chuàng)建方法介紹

3-13制作零售業(yè)銷(xiāo)售情況分析儀

3-14業(yè)務(wù)背景介紹

3-15客戶價(jià)值模型說(shuō)明

3-16數(shù)據(jù)加工處理

3-17制作電商客戶行為分析儀

3-18業(yè)務(wù)背景介紹

3-19理解餐飲業(yè)關(guān)鍵運(yùn)營(yíng)指標(biāo)

3-20數(shù)據(jù)加工處理

3-21制作餐飲業(yè)日銷(xiāo)售情況監(jiān)控儀

3-22電商業(yè)務(wù)背景介紹

3-23電商流量指標(biāo)體系說(shuō)明

3-24數(shù)據(jù)加工處理

3-25制作電商流量分析儀

3-26業(yè)務(wù)背景介紹

3-27進(jìn)銷(xiāo)存關(guān)鍵指標(biāo)說(shuō)明

3-28數(shù)據(jù)加工處理

3-29制作經(jīng)銷(xiāo)商經(jīng)營(yíng)情況分析儀

3-30業(yè)務(wù)背景介紹

3-31數(shù)據(jù)說(shuō)明

3-32制作車(chē)企銷(xiāo)售情況分析儀

3-33由講師介紹業(yè)務(wù)背景

3-34由講師提供數(shù)據(jù)

3-35由學(xué)員獨(dú)立完成業(yè)務(wù)分析儀的制作過(guò)程

3-36由學(xué)員分組發(fā)表制作成果并由講師點(diǎn)評(píng)

4章數(shù)據(jù)挖掘數(shù)學(xué)基礎(chǔ)

4-1函數(shù)

4-2極限

4-3微分及應(yīng)用

4-4定積分

4-5向量

4-6線性方程組

4-7線性變化與矩陣

4-8矩陣乘法

4-9行列式

4-10矩陣的秩

4-11逆矩陣

4-12點(diǎn)乘與內(nèi)積

4-13外積

4-14特征值與特征向量

4-15集中趨勢(shì)的度量

4-16離散程度的度量

4-17偏態(tài)與峰態(tài)的度量

4-18統(tǒng)計(jì)量概念與常用統(tǒng)計(jì)量

4-19抽樣分布

4-20樣本均值的分布與中心極限定理

4-21樣本比例的抽樣分布

4-22兩個(gè)樣本平均值之差的分布

4-23樣本方差的分布

4-24假設(shè)檢驗(yàn)的基本概念

4-25一個(gè)總體參數(shù)的檢驗(yàn)

4-26兩個(gè)總體參數(shù)的檢驗(yàn)

4-27分類(lèi)數(shù)據(jù)與X2統(tǒng)計(jì)量

4-28擬合優(yōu)度檢驗(yàn)

4-29列聯(lián)分析:獨(dú)立性檢驗(yàn)

4-30線性關(guān)系的方向和強(qiáng)度

4-31協(xié)方差

4-32相關(guān)系數(shù)

4-33一元線性回歸模型

4-34多元線性回歸模型

4-35邏輯回歸模型

5章Python編程基礎(chǔ)

5-1Python簡(jiǎn)介

5-2Python安裝環(huán)境介紹

5-3Python常用IDE及Jupyter介紹

5-4Python第三方庫(kù)安裝

5-5編碼與標(biāo)識(shí)符

5-6Python保留字

5-7注釋和縮進(jìn)

5-8輸入和輸出

5-9變量及賦值

5-10數(shù)值

5-11字符串

5-12布爾值

5-13列表

5-14元組

5-15集合

5-16字典

5-17條件語(yǔ)句: If

5-18循環(huán)語(yǔ)句For和While

5-19Break語(yǔ)句

5-20Continue語(yǔ)句

5-21Pass語(yǔ)句

5-22錯(cuò)誤和異常捕捉語(yǔ)句

5-23異常和錯(cuò)誤處理

5-24邏輯判斷函數(shù)

5-25數(shù)值運(yùn)算函數(shù)

5-26序列函數(shù)

5-27類(lèi)型轉(zhuǎn)換函數(shù)

5-28函數(shù)定義

5-29函數(shù)參數(shù)

5-30默認(rèn)參數(shù)

5-31變量作用域

5-32全局變量和局部變量

5-33匿名函數(shù)

5-34列表生成式

5-35高級(jí)函數(shù): map、Reduce、 filter等

5-36模塊概念介紹

5-37import模塊導(dǎo)入

5-38自定義模塊

5-39文件讀寫(xiě)

5-40利用Python操作文件和目錄

5-41類(lèi)的定義

5-42類(lèi)對(duì)象

5-43類(lèi)方法

5-44Python連接數(shù)據(jù)庫(kù)方法

5-45利用Python操作數(shù)據(jù)庫(kù)

6章Python數(shù)據(jù)清洗

6-1NumPy基本介紹

6-2NumPy基本數(shù)據(jù)結(jié)構(gòu): Ndarray

6-3數(shù)組的索引與切片

6-4數(shù)組其他常用函數(shù)與方法

6-5Pandas基本數(shù)據(jù)結(jié)構(gòu): Series與DataFrame

6-6索引、切片與過(guò)濾

6-7排序與匯總

6-8DataFrame簡(jiǎn)單處理缺失值方法

6-9數(shù)據(jù)集的合并與連接

6-10重復(fù)值的處理

6-11數(shù)據(jù)集映射轉(zhuǎn)化方法

6-12異常值查找與替換

6-13排序和隨機(jī)抽樣

6-14DataFrame字符串常用操作

6-15DataFrame分組操作

6-16

6-17 DataFrame聚合操作

6-18DataFrame透視表的創(chuàng)建方法

6-19數(shù)據(jù)的獲取與存儲(chǔ)

6-20數(shù)據(jù)探索

6-21數(shù)據(jù)清洗實(shí)戰(zhàn)案例一

6-22數(shù)據(jù)清洗實(shí)戰(zhàn)案例二

7章Python數(shù)據(jù)可視化

7-1數(shù)據(jù)可視化入門(mén)

7-2常用可視化第三方庫(kù)介紹: matplotlib、seaborn、PyEcharts

7-3常用可視化圖形介紹,如餅圖、柱圖、條形圖、線圖散點(diǎn)圖等

7-4圖形選擇

7-5Pandas繪圖方法

7-6圖例配置方法和常用參數(shù)

7-7顏色條配置方法和常用參數(shù)

7-8subplot多子圖繪制方法

7-9文字與注釋、自定義坐標(biāo)軸方法

7-10Seaborn入門(mén)介紹

7-11Seaborn API介紹

7-12Seaborn繪圖示例

7-13Echarts介紹

7-14PyEcharts API介紹

7-15PyEcharts繪圖示例

8章Python統(tǒng)計(jì)分析

8-1數(shù)據(jù)描述

8-2數(shù)據(jù)分布與統(tǒng)計(jì)信息

8-3數(shù)據(jù)角色定義

8-4大數(shù)據(jù)存儲(chǔ)

8-5最小二乘估計(jì)

8-6線性回歸與相關(guān)

8-7線性回歸與方差分析

8-8數(shù)據(jù)分析流程

8-9多元線性回歸的假設(shè)

8-10正態(tài)分布問(wèn)題

8-11異方差問(wèn)題與處理

8-12異常值問(wèn)題與處理

8-13共線性問(wèn)題與處理

8-14內(nèi)生性問(wèn)題與處理

8-15logistic回歸與卡方

8-16大似然估計(jì)

8-17logistic回歸解析

8-18評(píng)分與預(yù)測(cè)

8-19分類(lèi)比例平衡問(wèn)題

8-20工具變量的使用

8-21啞變量處理

8-22變量篩選

9章機(jī)器學(xué)習(xí)快速入門(mén)

9-1機(jī)器學(xué)習(xí)入門(mén)介紹:機(jī)器學(xué)習(xí)基本思想、常用算法分類(lèi)、算法庫(kù)等

9-2Python機(jī)器學(xué)習(xí)算法庫(kù)Scikit-Learn入門(mén)介紹

9-3超參數(shù)與模型驗(yàn)證:學(xué)習(xí)曲線、網(wǎng)格搜索

9-4特征工程概念介紹

9-5分類(lèi)特征、文本特征

9-6圖像特征、特征衍生

9-7缺失值填充、特征管道

9-8KNN基本原理

9-9KNN函數(shù)詳解

9-10KNN高級(jí)數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)

9-11原理補(bǔ)充:歸一化方法、學(xué)習(xí)曲線、交叉驗(yàn)證

9-12KNN-最近鄰分類(lèi)器

9-13KNN算法示例

9-14無(wú)監(jiān)督學(xué)習(xí)與聚類(lèi)算法

9-15聚類(lèi)分析概述與簇的概念

9-16距離衡量方法

9-17聚類(lèi)目標(biāo)函數(shù)和質(zhì)心計(jì)算方法

9-18Scikit-Learn實(shí)現(xiàn)K-Means及主要參數(shù)解

9-19決策樹(shù)工作原理

9-20構(gòu)建決策樹(shù)(ID3算法構(gòu)建決策樹(shù)及局限性)

9-****.5與CART算法

9-22決策樹(shù)的Scikit-Learn實(shí)現(xiàn):八個(gè)參數(shù)、一個(gè)屬性、四個(gè)接口解析

9-23分類(lèi)模型的評(píng)估指標(biāo)(混淆矩陣原理)

9-24實(shí)例:泰坦尼克號(hào)幸存者的預(yù)測(cè)

9-25過(guò)擬合與欠擬合

9-26決策樹(shù)算法評(píng)價(jià)(優(yōu)點(diǎn)與缺點(diǎn))

9-27決策樹(shù)在保險(xiǎn)行業(yè)中的應(yīng)用

10章機(jī)器學(xué)習(xí)進(jìn)階

10-1線性回歸概述

10-2多元線性回歸基本原理

10-3模型參數(shù)求解方法

10-4回歸類(lèi)模型評(píng)價(jià)標(biāo)準(zhǔn):精準(zhǔn)性、擬合度

10-5多重共線性與嶺回歸、Lasso

10-6非線性問(wèn)題及其處理方法

10-7多項(xiàng)式回歸

10-8MSE

10-9R^2

10-10最小二乘法

10-11梯度下降

10-12名為“回歸\"的分類(lèi)器

10-13二元邏輯回歸的損失函數(shù)

10-14邏輯回歸的重要參數(shù)

10-15梯度下降求解邏輯回歸最小損失函數(shù)

10-16概率分類(lèi)器概述

10-17樸素貝葉斯概述

10-18不同分布下的樸素貝葉斯

10-19高斯貝葉斯下的擬合效果與運(yùn)算速度

10-20多項(xiàng)式樸素貝葉斯及其優(yōu)化

10-21AUC

10-22ROC

10-23關(guān)聯(lián)規(guī)則概述:頻繁項(xiàng)集的產(chǎn)生與

10-24關(guān)聯(lián)發(fā)現(xiàn)

10-25Apriori算法原理:先驗(yàn)原理

10-26使用Apriori算法來(lái)發(fā)現(xiàn)頻繁項(xiàng)集(生成候選項(xiàng)集(函數(shù)的構(gòu)建與封裝)、項(xiàng)集迭代函數(shù))

10-27協(xié)同概率概述

10-28協(xié)同過(guò)濾算法分類(lèi)

10-29基于商品的協(xié)同過(guò)濾

10-30基于協(xié)同過(guò)濾的商品個(gè)性化推薦

10-31集成算法概述Bagging Vs Boosting、集成算法的認(rèn)識(shí)

10-32隨機(jī)森林分類(lèi)器的實(shí)現(xiàn):重要參數(shù)、重要屬性和接口

10-33隨機(jī)森林回歸器的實(shí)現(xiàn):重要參數(shù)、屬性與接口

10-34機(jī)器學(xué)習(xí)中調(diào)參的基本思想(泛化誤差)

10-35調(diào)參應(yīng)用:隨機(jī)森林在乳腺癌數(shù)據(jù)上的調(diào)參

10-36MSE

10-37R^2

10-38最小二乘法

10-39梯度下降

10-40數(shù)據(jù)處理概述

10-41數(shù)據(jù)量綱處理:歸一化、標(biāo)準(zhǔn)化

10-42缺失值處理

10-43分類(lèi)型數(shù)據(jù)處理:數(shù)據(jù)編碼與啞變量

10-44連續(xù)性數(shù)據(jù)處理:二值化與分箱

10-45特征選擇:過(guò)濾法、嵌入法、包裝法

10-46SVM概述: SVM工作原理

10-47SVM模型構(gòu)建

10-48線性SVM:線性SVM的損失函數(shù)、函數(shù)間隔有幾何間隔、SVM決策邊界

10-49非線性SVM: SVC模型概述、重要參數(shù)、核函數(shù)、SVC重要參數(shù)(C、class weight)

10-50感知機(jī)

10-51多層感知機(jī)

10-52初識(shí)神經(jīng)網(wǎng)絡(luò)

10-53梯度提升樹(shù)概述

10-54XGBoost選擇若分類(lèi)器

10-55求解目標(biāo)函數(shù)

10-56參數(shù)化決策樹(shù)

10-57建立目標(biāo)函數(shù)與樹(shù)結(jié)構(gòu)的直接關(guān)系

10-58貪婪算法與求解優(yōu)樹(shù)

10-59XGBoost的剪枝參數(shù):減輕過(guò)擬合

10-60XGBoost分類(lèi)中的樣本不均衡問(wèn)題處

10-61基于XGboost的航空預(yù)測(cè)

11章評(píng)分卡案例

11-1評(píng)分卡業(yè)務(wù)邏輯介紹

11-2案例業(yè)務(wù)背景介紹

11-3基本分析工具與環(huán)境準(zhǔn)備

11-4數(shù)據(jù)準(zhǔn)備

11-5數(shù)據(jù)預(yù)處理

11-6數(shù)據(jù)比例調(diào)節(jié):過(guò)度抽樣

11-7構(gòu)造訓(xùn)練集和測(cè)試集

11-8變量相關(guān)性分析

11-9數(shù)據(jù)的缺失值與異常值

11-10變量數(shù)據(jù)類(lèi)型重編碼

11-11Logistic模型原理回顧

11-12Logistic建模

11-13利用Logistic模型進(jìn)行變量篩選

11-14分類(lèi)模型評(píng)估指標(biāo)回顧

11-15過(guò)度抽樣調(diào)整

11-16收益矩陣

11-17模型轉(zhuǎn)化評(píng)分卡

11-18Python模型部署方法

11-19構(gòu)建機(jī)器學(xué)習(xí)流

11-20模型效果監(jiān)測(cè)與更新

12章電商零售

12-1項(xiàng)目商業(yè)問(wèn)題簡(jiǎn)述

12-2項(xiàng)目策略與方法

12-3項(xiàng)目推薦計(jì)劃

12-4項(xiàng)目時(shí)間規(guī)劃

12-5購(gòu)買(mǎi)傾向模型

12-6方法原理介紹

12-7目標(biāo)以及數(shù)據(jù)介紹

12-8Python算法實(shí)現(xiàn)(Gradient Boosting)

12-9建模結(jié)果解讀

12-10購(gòu)買(mǎi)傾向模型

12-11目標(biāo)以及數(shù)據(jù)介紹

12-12Python算法實(shí)現(xiàn)

12-13建模結(jié)果解讀

12-14活動(dòng)設(shè)計(jì)

12-15結(jié)果評(píng)價(jià)

13章Python網(wǎng)絡(luò)爬蟲(chóng)(錄播)

13-1網(wǎng)絡(luò)爬蟲(chóng)定義

13-2網(wǎng)絡(luò)爬蟲(chóng)用途

13-3通用搜索引擎工作的原理和局限性

13-4爬蟲(chóng)基本原理與流程

13-5常見(jiàn)網(wǎng)絡(luò)爬蟲(chóng)分類(lèi)

13-6基于IP地址搜索策略

13-7廣度優(yōu)先搜索策略

13-8深度優(yōu)先搜索策略

13-9優(yōu)先搜索策略

13-10http基本原理介紹

13-11http請(qǐng)求過(guò)程

13-12網(wǎng)頁(yè)組成

13-13HTML:超文本標(biāo)記語(yǔ)言

13-14CSS:層疊樣式表

13-15網(wǎng)頁(yè)樣式

13-16JavaScript(JS)

13-17網(wǎng)頁(yè)的結(jié)構(gòu)

13-18爬蟲(chóng)基本流程

13-19抓取數(shù)據(jù)的數(shù)據(jù)類(lèi)型解析

13-20JavaScript渲染頁(yè)面

13-21cookies介紹

13-22爬蟲(chóng)代理

13-23Robots協(xié)議介紹

13-24爬蟲(chóng)攻防入門(mén)

14章Tableau數(shù)據(jù)分析 (錄播)

14-1Tableau產(chǎn)品介紹

14-2Tableau操作界面介紹

14-3Tableau常用功能介紹

14-4Tableau連接數(shù)據(jù)源方法

14-5層級(jí)與下鉆

14-6排序和分組

14-7創(chuàng)建和使用集

14-8篩選方法:篩選欄和篩選器

14-9數(shù)據(jù)處理常用參數(shù)

14-10參考線與趨勢(shì)線

14-11常用預(yù)測(cè)方法

14-12可視化基本方法

14-13初級(jí)圖表繪制方法:條形圖、折線圖、餅圖、文字云、散點(diǎn)圖、地圖、樹(shù)形圖、氣泡圖等

14-14高級(jí)圖表:子彈圖、環(huán)形圖、瀑布圖、Bump Chart、Table Formatting

14-15使用Tableau制作儀表板

14-16邏輯運(yùn)算

14-17數(shù)值運(yùn)算

14-18字符串處理函數(shù)

14-19日期函數(shù)

14-20聚合函數(shù)

14-21數(shù)據(jù)背景和需求分析

14-22數(shù)據(jù)讀取與預(yù)處理

14-23Top N客戶匯總分析

14-24Top N客戶銷(xiāo)售額分析

15章分布式集群架構(gòu)

15-1大數(shù)據(jù)概念介紹

15-2Hadoop入門(mén)與分布式集群基本概念

15-3Hadoop生態(tài)和及其技術(shù)棧

15-4Linux生態(tài)介紹

15-5常用虛擬化工具介紹

15-6常用Linux操作系統(tǒng)

15-7Vmware與VirtualBox

15-8Ubuntu操作系統(tǒng)與CentOS

15-9Ubuntu安裝與常用命令

15-10JDK的安裝與使用

15-11Hadoop安裝與使用

15-12Hadoop單機(jī)運(yùn)行方法

15-13Hadoop偽分布式運(yùn)行方法

15-14利用多節(jié)點(diǎn)安裝Hadoop集群

15-15Hadoop生態(tài)其他常用組件基本介紹

15-16數(shù)據(jù)倉(cāng)庫(kù)Hive安裝方法

15-17分布式數(shù)據(jù)庫(kù)Hbase安裝方法

15-18ETL工具Sqoop安裝方法

15-19Scala與Spark安裝方法

16章Hadoop基礎(chǔ)

16-1HDFS概念及設(shè)計(jì)原理

16-2HDFS體系結(jié)構(gòu)和運(yùn)行機(jī)制

16-3NameNode、DataNode、SecondaryNameNode配置文件及修改方法

16-4HDFS備份機(jī)制和文件管理機(jī)制

16-5NameNode、DataNode、SecondaryNameNode作用及運(yùn)行機(jī)制

16-6HDFS的常用操作方法介紹

16-7HDFS Java API介紹

16-8HDFS Shell命令格式

16-9HDFS創(chuàng)建文件目錄命令

16-10HDFS文件復(fù)制、重命名命令

16-11HDFS文件移動(dòng)、刪除命令

16-12HDFS其他常用命令

16-13YARN基本概念

16-14YARN相關(guān)進(jìn)程介紹

16-15YARN核心組件及其功能

16-16YARN運(yùn)行原理

16-17MapReduce概念及設(shè)計(jì)原理

16-18MapReduce運(yùn)行過(guò)程類(lèi)的調(diào)用過(guò)程

16-19Mapper類(lèi)和Reducer類(lèi)的繼承機(jī)制

16-20Job生命周期

16-21MapReduce中block的調(diào)度及作業(yè)分配機(jī)制

16-22Mapreduce程序格式介紹

16-23MapReduce程序執(zhí)行流程介紹

16-24MapReduce程序在瀏覽器中查看

16-25Mappre類(lèi)和Reducer類(lèi)的主要編寫(xiě)內(nèi)容和模式

16-26Job的編寫(xiě)和實(shí)現(xiàn)

16-27MapReduce程序編寫(xiě)實(shí)操

16-28Jar包打包方法和集群運(yùn)行

17章Sqoop安裝與使用

17-1Sqoop組件介紹與發(fā)展歷史

17-2Sqoop組件特性及核心功能

17-3ETL基本概念

17-4Hadoop生態(tài)中的數(shù)據(jù)轉(zhuǎn)化方法

17-5Linux中安裝Sqoop方法

17-6Sqoop集成MySQL方法

17-7Sqoop集成Hbase方法

17-8Sqoop集成Hive方法

17-9Sqoop功能測(cè)試

17-10Sqoop導(dǎo)入功能介紹

17-11Sqoop數(shù)據(jù)導(dǎo)入import命令基本格式

17-12Sqoop數(shù)據(jù)導(dǎo)入import命令常用參數(shù)

17-13利用Sqoop從MySQL中導(dǎo)入數(shù)據(jù)至HDFS

17-14Sqoop生成相應(yīng)Java代碼方法codegen

17-15利用Sqoop導(dǎo)入數(shù)據(jù)至Hive

17-16利用Sqoop導(dǎo)入數(shù)據(jù)至Hbase

17-17Sqoop導(dǎo)出功能介紹

17-18Sqoop數(shù)據(jù)導(dǎo)入export命令基本格式

17-19Sqoop數(shù)據(jù)導(dǎo)入export命令常用參數(shù)

17-20從HDFS中導(dǎo)出數(shù)據(jù)到MySQL

17-21從Hive導(dǎo)出數(shù)據(jù)到MySQL

17-22從Hbase導(dǎo)出數(shù)據(jù)到MySQL

18章分布式數(shù)據(jù)倉(cāng)庫(kù)Hbase

18-1分布式數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)

18-2No-SQL數(shù)據(jù)庫(kù)與面向列數(shù)據(jù)庫(kù)特性講解

18-3Hbase發(fā)展歷史

18-4Hbase核心特性

18-5Hbase在Linux中的安裝方法

18-6Hbase配置文件與修改方法

18-7Hbase與Zookeeper集成

18-8Hbase完全分布式安裝與運(yùn)行

18-9簡(jiǎn)單備份模式

18-10Hbase邏輯模型

18-11Hbase物理模型

18-12paxos算法與運(yùn)行機(jī)制

18-13靜態(tài)遷移與動(dòng)態(tài)遷移

18-14Hbase基本操作方法

18-15Hbase Shell通用命令General

18-16表格創(chuàng)建命令Create

18-17常用查看命令list、describe

18-18使用put命令添加數(shù)據(jù)

18-19刪除數(shù)據(jù)delete、delete all命令

18-20查看數(shù)據(jù)scan、get命令

18-21修改數(shù)據(jù)命令alter

18-22表格刪除方法

18-23其他統(tǒng)計(jì)方法

18-24Hbase和Hive集成概述

18-25Hbase和Hive集成方法

18-26使用HQL操作Hbase中數(shù)據(jù)

18-27Hbase和Spark集成概述

18-28Hbase和Spark集成方法

18-29利用Spark編程讀取Hbase中數(shù)據(jù)

19章數(shù)據(jù)倉(cāng)庫(kù)工具Hive

19-1數(shù)據(jù)倉(cāng)庫(kù)誕生背景與概念介紹

19-2常用數(shù)據(jù)倉(cāng)庫(kù)工具介紹

19-3分布式數(shù)據(jù)倉(cāng)庫(kù)工具介紹

19-4Hive核心特性

19-5Hive部署與訪問(wèn)

19-6Hive常用元數(shù)據(jù)服務(wù)與訪問(wèn)接口

19-7Hive數(shù)據(jù)模型

19-8數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)

19-9Hive API distinct

19-10Hive API multi insert

19-11Hive API union all

19-12Hive API union all

19-13Hive API group by&order by

19-14Hive基本數(shù)據(jù)類(lèi)型

19-15Hive復(fù)雜數(shù)據(jù)類(lèi)型

19-16Hive數(shù)據(jù)定義方法

19-17創(chuàng)建、修改和刪除表方法

19-18視圖和索引的創(chuàng)建、修改和刪除

19-19表中加載數(shù)據(jù)的方法

19-20表中導(dǎo)出數(shù)據(jù)方法

19-21查詢操作

19-22連接操作

19-23子查詢

19-24數(shù)據(jù)倉(cāng)庫(kù)企業(yè)開(kāi)發(fā)平臺(tái)

19-25數(shù)據(jù)倉(cāng)庫(kù)模型設(shè)計(jì)

19-26自助查詢系統(tǒng)設(shè)計(jì)

19-27寬表設(shè)計(jì)與用戶畫(huà)像

19-28利用Hive進(jìn)行網(wǎng)站流量分析

20章Spark基本原理與核心組件

20-1分布式計(jì)算框架介紹

20-2Spark誕生背景與發(fā)展歷程

20-3Spark基本定位與核心特性

20-4Scala語(yǔ)言介紹:基礎(chǔ)語(yǔ)法、編譯環(huán)境、常用類(lèi)型、聲明;行、字符、二進(jìn)制與文本文件的讀取與寫(xiě)入

20-5Scala 函數(shù):控制結(jié)構(gòu)(賦值、條件、循環(huán)、輸入輸出)與函數(shù)(參數(shù)與過(guò)程);數(shù)組操作(定義、遍歷、轉(zhuǎn)換)及常用算法

20-6Scala對(duì)象操作:的類(lèi)和對(duì)象構(gòu)造與繼承、重寫(xiě)、抽象、轉(zhuǎn)換;類(lèi)與對(duì)象中特質(zhì)的屬性與使用,包的使用與引入

20-7Spark運(yùn)行架構(gòu)

20-8Spark運(yùn)行基本流程

20-9RDD設(shè)計(jì)背景與基本概念

20-10RDD特性

20-11RDD之間依賴(lài)關(guān)系

20-12RDD運(yùn)行過(guò)程

20-13Spark三種部署方式

20-14Spark與Hadoop統(tǒng)一部署

20-15Spark結(jié)構(gòu)化數(shù)據(jù)模塊Spark SQL

20-16Spark機(jī)器學(xué)習(xí)算法庫(kù)Spark MLlib

20-17Spark流式計(jì)算框架Spark Streaming

20-18新一代Spark流式計(jì)算框架Structured Streaming

20-19Spark圖計(jì)算框架GraphX

21章PySpark編程

21-1RDD創(chuàng)建方法

21-2RDD轉(zhuǎn)換操作

21-3RDD行動(dòng)操作

21-4RDD惰性機(jī)制

21-5RDD持久化操作

21-6打印元素方法

21-7鍵值對(duì)RDD創(chuàng)建方法

21-8常用鍵值對(duì)轉(zhuǎn)換操作:reduceByKey、groupByKey、keys、values、sortByKey、mapValues、join等操作

21-9鍵值對(duì)RDD編程案例

21-10廣播變量

21-11累加器

21-*********.sql模塊

21-***************ming模塊

21-********k.ml模塊

21-***********llib模塊

21-***************Conf類(lèi)

21-******************text類(lèi)

21-****************iles類(lèi)

21-*********.RDD類(lèi)

21-*****************ator類(lèi)

21-***************cast類(lèi)

22章Spark SQL

22-1Spark SQL與shark

22-2Spark SQL基本設(shè)計(jì)結(jié)構(gòu)

22-3Spark SQL高級(jí)數(shù)據(jù)結(jié)構(gòu)

22-4高級(jí)數(shù)據(jù)結(jié)構(gòu)DataFrame概念介紹

22-5DataFrame與RDD

22-6DataFrame創(chuàng)建方法

22-7DataFrame常用操作

22-8利用RDD轉(zhuǎn)化生成DataFrame

22-9利用反射機(jī)制推斷RDD模式方法

22-10使用編程方式定義RDD模式

22-11常用外部數(shù)據(jù)源

22-12Parquet基本介紹

22-13讀寫(xiě)Parquet方法

22-14讀取MySQL中數(shù)據(jù)方法

22-15連接Hive讀寫(xiě)數(shù)據(jù)方法

23章Spark ML

23-1機(jī)器學(xué)習(xí)入門(mén)介紹:機(jī)器學(xué)習(xí)基本思想、常用算法分類(lèi)、算法庫(kù)等

23-2Spark機(jī)器學(xué)習(xí)包ML和MLlib介紹

23-3特征矩陣與標(biāo)簽數(shù)組

23-4評(píng)估器與解釋器

23-5特征工程概念介紹

23-6機(jī)器學(xué)習(xí)流概念介紹

23-7MLlib入門(mén)介紹

23-8MLlib向量的創(chuàng)建與使用,包括密集向量、稀疏向量、標(biāo)簽向量等

23-9MLlib矩陣的創(chuàng)建與使用,包括行矩陣、坐標(biāo)矩陣、本地矩陣等

23-10MLlib基本統(tǒng)計(jì)方法:概括統(tǒng)計(jì)、相關(guān)性、抽樣方法、假設(shè)檢驗(yàn)、核密度估計(jì)等

23-11降維操作:PCA主成分分析與SVD奇異值分解

23-12線性回歸分析

23-13邏輯歸回

23-14決策樹(shù)和隨機(jī)森林

23-15支持向量機(jī)SVM

23-16ML機(jī)器學(xué)習(xí)流創(chuàng)建方法

23-17特征抽取、轉(zhuǎn)化和選擇:TF-IDF、CountVectorizer、Word2Vec

23-18快速聚類(lèi)算法

23-19協(xié)同過(guò)濾算法

23-20集成算法

23-21反向傳播神經(jīng)網(wǎng)絡(luò)

23-22SVM支持向量機(jī)分類(lèi)和支持向量機(jī)回歸

24章Spark Streaming

24-1流式計(jì)算簡(jiǎn)介

24-2流式計(jì)算核心概念

24-3常用流式計(jì)算框架介紹

24-4Spark流式計(jì)算框架:Spark Streaming與Structured Streaming

24-5流式計(jì)算數(shù)據(jù)源介紹

24-6常用高級(jí)數(shù)據(jù)源

24-7分布式日志系統(tǒng)Flume介紹與安裝

24-8Flume使用方法

24-9分布式消息系統(tǒng)Kafka介紹與安裝

24-10Kafka使用方法

24-11Kafka和Flume集成

24-12Spark Streaming簡(jiǎn)介

24-13Spark Streaming計(jì)算框架基本架構(gòu)

24-14Dstream隊(duì)列流基本概念

24-15Spark Streaming與基本數(shù)據(jù)源集成:文件流、套接字流、RDD隊(duì)列流

24-16Spark Streaming與高級(jí)數(shù)據(jù)源集成:Kafka、Flume

24-17 Dstream轉(zhuǎn)化操作與輸出操作

24-18Structured Streaming簡(jiǎn)介

24-19Structured Streaming基本架構(gòu)與計(jì)算流程

24-20DatazFrame創(chuàng)建與轉(zhuǎn)換

24-21利用Structured Streaming進(jìn)行流查詢

24-22通過(guò)編寫(xiě)?yīng)毩?yīng)用使用Structured Streaming

25章GraphX

25-1圖計(jì)算基本概念

25-2圖概念

25-3圖處理技術(shù),如圖數(shù)據(jù)庫(kù)、圖數(shù)據(jù)查詢、圖數(shù)據(jù)分析、圖數(shù)據(jù)可視化等

25-4圖計(jì)算軟件

25-5屬性圖概念

25-6屬性圖實(shí)例

25-7創(chuàng)建屬性圖方法

25-8graphx類(lèi)介紹

25-9使用RDD構(gòu)建圖

25-10查看操作列表

25-11屬性操作

25-12結(jié)構(gòu)操作

25-13關(guān)聯(lián)操作

25-14聚合操作

25-15緩存操作

25-16PageRank算法

25-17連通分支算法

25-18三角形計(jì)算算法

26章Flink流處理框架

26-1Flink的重要特點(diǎn)

26-2IDEA 集成開(kāi)發(fā)環(huán)境

26-3Java基礎(chǔ)及應(yīng)用:基礎(chǔ)語(yǔ)法、面向?qū)ο蟆惓L幚?、IO流、注解、反射等

26-4Flink部署

26-5Flink運(yùn)行架構(gòu)

26-6Flink 流處理API

26-7Flink中的Window

26-8時(shí)間語(yǔ)義與Wartermark

26-9ProcessFunction API

26-10狀態(tài)編程和容錯(cuò)機(jī)制

26-11Table API 與SQL

26-12Flink CEP

27章大數(shù)據(jù)分析案例(三選二)

27-1數(shù)據(jù)采集平臺(tái)、數(shù)倉(cāng)、離線\\實(shí)時(shí)分析平臺(tái)設(shè)計(jì)、框架選型、搭建流程及常見(jiàn)問(wèn)題總結(jié)

27-2數(shù)據(jù)挖掘方法回顧

27-3CRISP-DM方法和SEMMA方法

27-4數(shù)據(jù)挖掘方法在大數(shù)據(jù)分析中的實(shí)踐應(yīng)用方法

27-5利用HDFS和Hbase進(jìn)行簡(jiǎn)單數(shù)據(jù)處理

27-6利用Sqoop完成數(shù)據(jù)ETL過(guò)程

27-7利用數(shù)據(jù)倉(cāng)庫(kù)工具和Spark SQL進(jìn)行數(shù)據(jù)清洗

27-8利用Spark MLlib構(gòu)建機(jī)器學(xué)習(xí)流進(jìn)行建模分析

27-9利用PyEcharts進(jìn)行結(jié)果可視化展示

27-10流量:用戶畫(huà)像與精細(xì)化營(yíng)銷(xiāo)

27-11產(chǎn)品:產(chǎn)品生命周期管理

27-12活動(dòng):KPI檢測(cè)體系構(gòu)建

27-13品牌:品類(lèi)管理與多位能力模型構(gòu)建

27-14客戶:客戶細(xì)分與用戶畫(huà)像

27-15產(chǎn)品:產(chǎn)品生命周期與用戶關(guān)系管理

27-16營(yíng)銷(xiāo):精準(zhǔn)營(yíng)銷(xiāo)、網(wǎng)絡(luò)獲客、客戶維護(hù)與客戶生命周期管理

27-17用戶離網(wǎng)分析

27-18客戶價(jià)值評(píng)估

27-19用戶細(xì)分

27-20電信反欺詐模型的構(gòu)建1章業(yè)務(wù)分析基礎(chǔ)技能

1-1數(shù)據(jù)分析概述

1-2常用高階函數(shù)

1-3條件格式應(yīng)用

1-4數(shù)據(jù)透視表高階應(yīng)用

1-5圖表進(jìn)階

1-6項(xiàng)目排期管理

1-7案例背景介紹

1-8動(dòng)態(tài)考勤表制作

1-9每月考勤統(tǒng)計(jì)

1-10考勤匯總統(tǒng)計(jì)

1-11常用指標(biāo)概述

1-12基礎(chǔ)指標(biāo)統(tǒng)計(jì)

1-13人力資源指標(biāo)體系概述

1-14案例背景介紹

1-15員工績(jī)效評(píng)定思路解析

1-16實(shí)操績(jī)效統(tǒng)計(jì)及可視化

1-17案例背景介紹

1-18活動(dòng)評(píng)估報(bào)表思路解析

1-19實(shí)操活動(dòng)評(píng)估指標(biāo)統(tǒng)計(jì)

1-20指導(dǎo)撰寫(xiě)報(bào)表結(jié)論

1-21圖表應(yīng)用

1-22零碎需求分析方法

1-23案例應(yīng)用-核心產(chǎn)品分析

1-24案例應(yīng)用-零售業(yè)商業(yè)智能看板

1-25RFM基礎(chǔ)模型及拓展

1-26案例應(yīng)用-用戶畫(huà)像

1-27樹(shù)狀結(jié)構(gòu)分析方法概述

1-28案例應(yīng)用-汽車(chē)行業(yè)分析報(bào)告

2章數(shù)據(jù)庫(kù)應(yīng)用技能

2-1數(shù)據(jù)庫(kù)簡(jiǎn)介

2-2表結(jié)構(gòu)的特點(diǎn)

2-3數(shù)據(jù)庫(kù)分類(lèi)

2-4MySQL簡(jiǎn)介

2-5數(shù)據(jù)庫(kù)基本結(jié)構(gòu)

2-6SQL語(yǔ)言分類(lèi)

2-7SQL書(shū)寫(xiě)要求

2-8創(chuàng)建、使用及刪除數(shù)據(jù)庫(kù)

2-9創(chuàng)建表

2-10數(shù)據(jù)類(lèi)型

2-11約束條件

2-12修改及刪除表

2-13插入數(shù)據(jù)

2-14批量導(dǎo)入數(shù)據(jù)

2-15更新數(shù)據(jù)

2-16刪除數(shù)據(jù)

2-17查詢指定列

2-18查詢不重復(fù)記錄

2-19條件查詢

2-20常用運(yùn)算符

2-21空值查詢

2-22設(shè)置別名

2-23模糊查詢

2-24查詢結(jié)果排序

2-25限制查詢

2-26聚合運(yùn)算

2-27分組查詢

2-28分組后篩選

2-29內(nèi)連接

2-30左連接

2-31右連接

2-32合并查詢

2-33標(biāo)量子查詢

2-34行子查詢

2-35列子查詢

2-36表子查詢

2-37字符串函數(shù)

2-38數(shù)學(xué)函數(shù)

2-39日期和時(shí)間函數(shù)

2-40分組合并函數(shù)

2-41邏輯函數(shù)

2-42開(kāi)窗函數(shù)

2-43進(jìn)階練習(xí)

2-44數(shù)據(jù)來(lái)源及業(yè)務(wù)背景

2-45表關(guān)系梳理

2-46數(shù)據(jù)導(dǎo)入及字段處理

2-47數(shù)據(jù)查詢

3章商業(yè)智能分析技能

3-1數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)說(shuō)明

3-2基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)處理方法

3-3數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理進(jìn)階

3-4數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用案例

3-5創(chuàng)建多維數(shù)據(jù)模型

3-6理解多維模型表連接規(guī)則

3-7業(yè)務(wù)數(shù)據(jù)分析指標(biāo)介紹

3-8業(yè)務(wù)數(shù)據(jù)匯總分析進(jìn)階

3-9時(shí)間維度分析方法說(shuō)明

3-10業(yè)務(wù)背景介紹

3-11理解及加工處理數(shù)據(jù)

3-12可視化界面創(chuàng)建方法介紹

3-13制作零售業(yè)銷(xiāo)售情況分析儀

3-14業(yè)務(wù)背景介紹

3-15客戶價(jià)值模型說(shuō)明

3-16數(shù)據(jù)加工處理

3-17制作電商客戶行為分析儀

3-18業(yè)務(wù)背景介紹

3-19理解餐飲業(yè)關(guān)鍵運(yùn)營(yíng)指標(biāo)

3-20數(shù)據(jù)加工處理

3-21制作餐飲業(yè)日銷(xiāo)售情況監(jiān)控儀

3-22電商業(yè)務(wù)背景介紹

3-23電商流量指標(biāo)體系說(shuō)明

3-24數(shù)據(jù)加工處理

3-25制作電商流量分析儀

3-26業(yè)務(wù)背景介紹

3-27進(jìn)銷(xiāo)存關(guān)鍵指標(biāo)說(shuō)明

3-28數(shù)據(jù)加工處理

3-29制作經(jīng)銷(xiāo)商經(jīng)營(yíng)情況分析儀

3-30業(yè)務(wù)背景介紹

3-31數(shù)據(jù)說(shuō)明

3-32制作車(chē)企銷(xiāo)售情況分析儀

3-33由講師介紹業(yè)務(wù)背景

3-34由講師提供數(shù)據(jù)

3-35由學(xué)員獨(dú)立完成業(yè)務(wù)分析儀的制作過(guò)程

3-36由學(xué)員分組發(fā)表制作成果并由講師點(diǎn)評(píng)

4章數(shù)據(jù)挖掘數(shù)學(xué)基礎(chǔ)

4-1函數(shù)

4-2極限

4-3微分及應(yīng)用

4-4定積分

4-5向量

4-6線性方程組

4-7線性變化與矩陣

4-8矩陣乘法

4-9行列式

4-10矩陣的秩

4-11逆矩陣

4-12點(diǎn)乘與內(nèi)積

4-13外積

4-14特征值與特征向量

4-15集中趨勢(shì)的度量

4-16離散程度的度量

4-17偏態(tài)與峰態(tài)的度量

4-18統(tǒng)計(jì)量概念與常用統(tǒng)計(jì)量

4-19抽樣分布

4-20樣本均值的分布與中心極限定理

4-21樣本比例的抽樣分布

4-22兩個(gè)樣本平均值之差的分布

4-23樣本方差的分布

4-24假設(shè)檢驗(yàn)的基本概念

4-25一個(gè)總體參數(shù)的檢驗(yàn)

4-26兩個(gè)總體參數(shù)的檢驗(yàn)

4-27分類(lèi)數(shù)據(jù)與X2統(tǒng)計(jì)量

4-28擬合優(yōu)度檢驗(yàn)

4-29列聯(lián)分析:獨(dú)立性檢驗(yàn)

4-30線性關(guān)系的方向和強(qiáng)度

4-31協(xié)方差

4-32相關(guān)系數(shù)

4-33一元線性回歸模型

4-34多元線性回歸模型

4-35邏輯回歸模型

5章Python編程基礎(chǔ)

5-1Python簡(jiǎn)介

5-2Python安裝環(huán)境介紹

5-3Python常用IDE及Jupyter介紹

5-4Python第三方庫(kù)安裝

5-5編碼與標(biāo)識(shí)符

5-6Python保留字

5-7注釋和縮進(jìn)

5-8輸入和輸出

5-9變量及賦值

5-10數(shù)值

5-11字符串

5-12布爾值

5-13列表

5-14元組

5-15集合

5-16字典

5-17條件語(yǔ)句: If

5-18循環(huán)語(yǔ)句For和While

5-19Break語(yǔ)句

5-20Continue語(yǔ)句

5-21Pass語(yǔ)句

5-22錯(cuò)誤和異常捕捉語(yǔ)句

5-23異常和錯(cuò)誤處理

5-24邏輯判斷函數(shù)

5-25數(shù)值運(yùn)算函數(shù)

5-26序列函數(shù)

5-27類(lèi)型轉(zhuǎn)換函數(shù)

5-28函數(shù)定義

5-29函數(shù)參數(shù)

5-30默認(rèn)參數(shù)

5-31變量作用域

5-32全局變量和局部變量

5-33匿名函數(shù)

5-34列表生成式

5-35高級(jí)函數(shù): map、Reduce、 filter等

5-36模塊概念介紹

5-37import模塊導(dǎo)入

5-38自定義模塊

5-39文件讀寫(xiě)

5-40利用Python操作文件和目錄

5-41類(lèi)的定義

5-42類(lèi)對(duì)象

5-43類(lèi)方法

5-44Python連接數(shù)據(jù)庫(kù)方法

5-45利用Python操作數(shù)據(jù)庫(kù)

6章Python數(shù)據(jù)清洗

6-1NumPy基本介紹

6-2NumPy基本數(shù)據(jù)結(jié)構(gòu): Ndarray

6-3數(shù)組的索引與切片

6-4數(shù)組其他常用函數(shù)與方法

6-5Pandas基本數(shù)據(jù)結(jié)構(gòu): Series與DataFrame

6-6索引、切片與過(guò)濾

6-7排序與匯總

6-8DataFrame簡(jiǎn)單處理缺失值方法

6-9數(shù)據(jù)集的合并與連接

6-10重復(fù)值的處理

6-11數(shù)據(jù)集映射轉(zhuǎn)化方法

6-12異常值查找與替換

6-13排序和隨機(jī)抽樣

6-14DataFrame字符串常用操作

6-15DataFrame分組操作

6-16

6-17 DataFrame聚合操作

6-18DataFrame透視表的創(chuàng)建方法

6-19數(shù)據(jù)的獲取與存儲(chǔ)

6-20數(shù)據(jù)探索

6-21數(shù)據(jù)清洗實(shí)戰(zhàn)案例一

6-22數(shù)據(jù)清洗實(shí)戰(zhàn)案例二

7章Python數(shù)據(jù)可視化

7-1數(shù)據(jù)可視化入門(mén)

7-2常用可視化第三方庫(kù)介紹: matplotlib、seaborn、PyEcharts

7-3常用可視化圖形介紹,如餅圖、柱圖、條形圖、線圖散點(diǎn)圖等

7-4圖形選擇

7-5Pandas繪圖方法

7-6圖例配置方法和常用參數(shù)

7-7顏色條配置方法和常用參數(shù)

7-8subplot多子圖繪制方法

7-9文字與注釋、自定義坐標(biāo)軸方法

7-10Seaborn入門(mén)介紹

7-11Seaborn API介紹

7-12Seaborn繪圖示例

7-13Echarts介紹

7-14PyEcharts API介紹

7-15PyEcharts繪圖示例

8章Python統(tǒng)計(jì)分析

8-1數(shù)據(jù)描述

8-2數(shù)據(jù)分布與統(tǒng)計(jì)信息

8-3數(shù)據(jù)角色定義

8-4大數(shù)據(jù)存儲(chǔ)

8-5最小二乘估計(jì)

8-6線性回歸與相關(guān)

8-7線性回歸與方差分析

8-8數(shù)據(jù)分析流程

8-9多元線性回歸的假設(shè)

8-10正態(tài)分布問(wèn)題

8-11異方差問(wèn)題與處理

8-12異常值問(wèn)題與處理

8-13共線性問(wèn)題與處理

8-14內(nèi)生性問(wèn)題與處理

8-15logistic回歸與卡方

8-16似然估計(jì)

8-17logistic回歸解析

8-18評(píng)分與預(yù)測(cè)

8-19分類(lèi)比例平衡問(wèn)題

8-20工具變量的使用

8-21啞變量處理

8-22變量篩選

9章機(jī)器學(xué)習(xí)快速入門(mén)

9-1機(jī)器學(xué)習(xí)入門(mén)介紹:機(jī)器學(xué)習(xí)基本思想、常用算法分類(lèi)、算法庫(kù)等

9-2Python機(jī)器學(xué)習(xí)算法庫(kù)Scikit-Learn入門(mén)介紹

9-3超參數(shù)與模型驗(yàn)證:學(xué)習(xí)曲線、網(wǎng)格搜索

9-4特征工程概念介紹

9-5分類(lèi)特征、文本特征

9-6圖像特征、特征衍生

9-7缺失值填充、特征管道

9-8KNN基本原理

9-9KNN函數(shù)詳解

9-10KNN高級(jí)數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)

9-11原理補(bǔ)充:歸一化方法、學(xué)習(xí)曲線、交叉驗(yàn)證

9-12KNN-最近鄰分類(lèi)器

9-13KNN算法示例

9-14無(wú)監(jiān)督學(xué)習(xí)與聚類(lèi)算法

9-15聚類(lèi)分析概述與簇的概念

9-16距離衡量方法

9-17聚類(lèi)目標(biāo)函數(shù)和質(zhì)心計(jì)算方法

9-18Scikit-Learn實(shí)現(xiàn)K-Means及主要參數(shù)解

9-19決策樹(shù)工作原理

9-20構(gòu)建決策樹(shù)(ID3算法構(gòu)建決策樹(shù)及局限性)

9-****.5與CART算法

9-22決策樹(shù)的Scikit-Learn實(shí)現(xiàn):八個(gè)參數(shù)、一個(gè)屬性、四個(gè)接口解析

9-23分類(lèi)模型的評(píng)估指標(biāo)(混淆矩陣原理)

9-24實(shí)例:泰坦尼克號(hào)幸存者的預(yù)測(cè)

9-25過(guò)擬合與欠擬合

9-26決策樹(shù)算法評(píng)價(jià)(優(yōu)點(diǎn)與缺點(diǎn))

9-27決策樹(shù)在保險(xiǎn)行業(yè)中的應(yīng)用

10章機(jī)器學(xué)習(xí)進(jìn)階

10-1線性回歸概述

10-2多元線性回歸基本原理

10-3模型參數(shù)求解方法

10-4回歸類(lèi)模型評(píng)價(jià)標(biāo)準(zhǔn):精準(zhǔn)性、擬合度

10-5多重共線性與嶺回歸、Lasso

10-6非線性問(wèn)題及其處理方法

10-7多項(xiàng)式回歸

10-8MSE

10-9R^2

10-10最小二乘法

10-11梯度下降

10-12名為“回歸\"的分類(lèi)器

10-13二元邏輯回歸的損失函數(shù)

10-14邏輯回歸的重要參數(shù)

10-15梯度下降求解邏輯回歸最小損失函數(shù)

10-16概率分類(lèi)器概述

10-17樸素貝葉斯概述

10-18不同分布下的樸素貝葉斯

10-19高斯貝葉斯下的擬合效果與運(yùn)算速度

10-20多項(xiàng)式樸素貝葉斯及其優(yōu)化

10-21AUC

10-22ROC

10-23關(guān)聯(lián)規(guī)則概述:頻繁項(xiàng)集的產(chǎn)生與

10-24關(guān)聯(lián)發(fā)現(xiàn)

10-25Apriori算法原理:先驗(yàn)原理

10-26使用Apriori算法來(lái)發(fā)現(xiàn)頻繁項(xiàng)集(生成候選項(xiàng)集(函數(shù)的構(gòu)建與封裝)、項(xiàng)集迭代函數(shù))

10-27協(xié)同概率概述

10-28協(xié)同過(guò)濾算法分類(lèi)

10-29基于商品的協(xié)同過(guò)濾

10-30基于協(xié)同過(guò)濾的商品個(gè)性化推薦

10-31集成算法概述Bagging Vs Boosting、集成算法的認(rèn)識(shí)

10-32隨機(jī)森林分類(lèi)器的實(shí)現(xiàn):重要參數(shù)、重要屬性和接口

10-33隨機(jī)森林回歸器的實(shí)現(xiàn):重要參數(shù)、屬性與接口

10-34機(jī)器學(xué)習(xí)中調(diào)參的基本思想(泛化誤差)

10-35調(diào)參應(yīng)用:隨機(jī)森林在乳腺癌數(shù)據(jù)上的調(diào)參

10-36MSE

10-37R^2

10-38最小二乘法

10-39梯度下降

10-40數(shù)據(jù)處理概述

10-41數(shù)據(jù)量綱處理:歸一化、標(biāo)準(zhǔn)化

10-42缺失值處理

10-43分類(lèi)型數(shù)據(jù)處理:數(shù)據(jù)編碼與啞變量

10-44連續(xù)性數(shù)據(jù)處理:二值化與分箱

10-45特征選擇:過(guò)濾法、嵌入法、包裝法

10-46SVM概述: SVM工作原理

10-47SVM模型構(gòu)建

10-48線性SVM:線性SVM的損失函數(shù)、函數(shù)間隔有幾何間隔、SVM決策邊界

10-49非線性SVM: SVC模型概述、重要參數(shù)、核函數(shù)、SVC重要參數(shù)(C、class weight)

10-50感知機(jī)

10-51多層感知機(jī)

10-52初識(shí)神經(jīng)網(wǎng)絡(luò)

10-53梯度提升樹(shù)概述

10-54XGBoost選擇若分類(lèi)器

10-55求解目標(biāo)函數(shù)

10-56參數(shù)化決策樹(shù)

10-57建立目標(biāo)函數(shù)與樹(shù)結(jié)構(gòu)的直接關(guān)系

10-58貪婪算法與求解優(yōu)樹(shù)

10-59XGBoost的剪枝參數(shù):減輕過(guò)擬合

10-60XGBoost分類(lèi)中的樣本不均衡問(wèn)題處

10-61基于XGboost的航空預(yù)測(cè)

11章評(píng)分卡案例

11-1評(píng)分卡業(yè)務(wù)邏輯介紹

11-2案例業(yè)務(wù)背景介紹

11-3基本分析工具與環(huán)境準(zhǔn)備

11-4數(shù)據(jù)準(zhǔn)備

11-5數(shù)據(jù)預(yù)處理

11-6數(shù)據(jù)比例調(diào)節(jié):過(guò)度抽樣

11-7構(gòu)造訓(xùn)練集和測(cè)試集

11-8變量相關(guān)性分析

11-9數(shù)據(jù)的缺失值與異常值

11-10變量數(shù)據(jù)類(lèi)型重編碼

11-11Logistic模型原理回顧

11-12Logistic建模

11-13利用Logistic模型進(jìn)行變量篩選

11-14分類(lèi)模型評(píng)估指標(biāo)回顧

11-15過(guò)度抽樣調(diào)整

11-16收益矩陣

11-17模型轉(zhuǎn)化評(píng)分卡

11-18Python模型部署方法

11-19構(gòu)建機(jī)器學(xué)習(xí)流

11-20模型效果監(jiān)測(cè)與更新

12章電商零售

12-1項(xiàng)目商業(yè)問(wèn)題簡(jiǎn)述

12-2項(xiàng)目策略與方法

12-3項(xiàng)目推薦計(jì)劃

12-4項(xiàng)目時(shí)間規(guī)劃

12-5購(gòu)買(mǎi)傾向模型

12-6方法原理介紹

12-7目標(biāo)以及數(shù)據(jù)介紹

12-8Python算法實(shí)現(xiàn)(Gradient Boosting)

12-9建模結(jié)果解讀

12-10購(gòu)買(mǎi)傾向模型

12-11目標(biāo)以及數(shù)據(jù)介紹

12-12Python算法實(shí)現(xiàn)

12-13建模結(jié)果解讀

12-14活動(dòng)設(shè)計(jì)

12-15結(jié)果評(píng)價(jià)

13章Python網(wǎng)絡(luò)爬蟲(chóng)(錄播)

13-1網(wǎng)絡(luò)爬蟲(chóng)定義

13-2網(wǎng)絡(luò)爬蟲(chóng)用途

13-3通用搜索引擎工作的原理和局限性

13-4爬蟲(chóng)基本原理與流程

13-5常見(jiàn)網(wǎng)絡(luò)爬蟲(chóng)分類(lèi)

13-6基于IP地址搜索策略

13-7廣度優(yōu)先搜索策略

13-8深度優(yōu)先搜索策略

13-9優(yōu)先搜索策略

13-10http基本原理介紹

13-11http請(qǐng)求過(guò)程

13-12網(wǎng)頁(yè)組成

13-13HTML:超文本標(biāo)記語(yǔ)言

13-14CSS:層疊樣式表

13-15網(wǎng)頁(yè)樣式

13-16JavaScript(JS)

13-17網(wǎng)頁(yè)的結(jié)構(gòu)

13-18爬蟲(chóng)基本流程

13-19抓取數(shù)據(jù)的數(shù)據(jù)類(lèi)型解析

13-20JavaScript渲染頁(yè)面

13-21cookies介紹

13-22爬蟲(chóng)代理

13-23Robots協(xié)議介紹

13-24爬蟲(chóng)攻防入門(mén)

14章Tableau數(shù)據(jù)分析 (錄播)

14-1Tableau產(chǎn)品介紹

14-2Tableau操作界面介紹

14-3Tableau常用功能介紹

14-4Tableau連接數(shù)據(jù)源方法

14-5層級(jí)與下鉆

14-6排序和分組

14-7創(chuàng)建和使用集

14-8篩選方法:篩選欄和篩選器

14-9數(shù)據(jù)處理常用參數(shù)

14-10參考線與趨勢(shì)線

14-11常用預(yù)測(cè)方法

14-12可視化基本方法

14-13初級(jí)圖表繪制方法:條形圖、折線圖、餅圖、文字云、散點(diǎn)圖、地圖、樹(shù)形圖、氣泡圖等

14-14高級(jí)圖表:子彈圖、環(huán)形圖、瀑布圖、Bump Chart、Table Formatting

14-15使用Tableau制作儀表板

14-16邏輯運(yùn)算

14-17數(shù)值運(yùn)算

14-18字符串處理函數(shù)

14-19日期函數(shù)

14-20聚合函數(shù)

14-21數(shù)據(jù)背景和需求分析

14-22數(shù)據(jù)讀取與預(yù)處理

14-23Top N客戶匯總分析

14-24Top N客戶銷(xiāo)售額分析

15章分布式集群架構(gòu)

15-1大數(shù)據(jù)概念介紹

15-2Hadoop入門(mén)與分布式集群基本概念

15-3Hadoop生態(tài)和及其技術(shù)棧

15-4Linux生態(tài)介紹

15-5常用虛擬化工具介紹

15-6常用Linux操作系統(tǒng)

15-7Vmware與VirtualBox

15-8Ubuntu操作系統(tǒng)與CentOS

15-9Ubuntu安裝與常用命令

15-10JDK的安裝與使用

15-11Hadoop安裝與使用

15-12Hadoop單機(jī)運(yùn)行方法

15-13Hadoop偽分布式運(yùn)行方法

15-14利用多節(jié)點(diǎn)安裝Hadoop集群

15-15Hadoop生態(tài)其他常用組件基本介紹

15-16數(shù)據(jù)倉(cāng)庫(kù)Hive安裝方法

15-17分布式數(shù)據(jù)庫(kù)Hbase安裝方法

15-18ETL工具Sqoop安裝方法

15-19Scala與Spark安裝方法

16章Hadoop基礎(chǔ)

16-1HDFS概念及設(shè)計(jì)原理

16-2HDFS體系結(jié)構(gòu)和運(yùn)行機(jī)制

16-3NameNode、DataNode、SecondaryNameNode配置文件及修改方法

16-4HDFS備份機(jī)制和文件管理機(jī)制

16-5NameNode、DataNode、SecondaryNameNode作用及運(yùn)行機(jī)制

16-6HDFS的常用操作方法介紹

16-7HDFS Java API介紹

16-8HDFS Shell命令格式

16-9HDFS創(chuàng)建文件目錄命令

16-10HDFS文件復(fù)制、重命名命令

16-11HDFS文件移動(dòng)、刪除命令

16-12HDFS其他常用命令

16-13YARN基本概念

16-14YARN相關(guān)進(jìn)程介紹

16-15YARN核心組件及其功能

16-16YARN運(yùn)行原理

16-17MapReduce概念及設(shè)計(jì)原理

16-18MapReduce運(yùn)行過(guò)程類(lèi)的調(diào)用過(guò)程

16-19Mapper類(lèi)和Reducer類(lèi)的繼承機(jī)制

16-20Job生命周期

16-21MapReduce中block的調(diào)度及作業(yè)分配機(jī)制

16-22Mapreduce程序格式介紹

16-23MapReduce程序執(zhí)行流程介紹

16-24MapReduce程序在瀏覽器中查看

16-25Mappre類(lèi)和Reducer類(lèi)的主要編寫(xiě)內(nèi)容和模式

16-26Job的編寫(xiě)和實(shí)現(xiàn)

16-27MapReduce程序編寫(xiě)實(shí)操

16-28Jar包打包方法和集群運(yùn)行

17章Sqoop安裝與使用

17-1Sqoop組件介紹與發(fā)展歷史

17-2Sqoop組件特性及核心功能

17-3ETL基本概念

17-4Hadoop生態(tài)中的數(shù)據(jù)轉(zhuǎn)化方法

17-5Linux中安裝Sqoop方法

17-6Sqoop集成MySQL方法

17-7Sqoop集成Hbase方法

17-8Sqoop集成Hive方法

17-9Sqoop功能測(cè)試

17-10Sqoop導(dǎo)入功能介紹

17-11Sqoop數(shù)據(jù)導(dǎo)入import命令基本格式

17-12Sqoop數(shù)據(jù)導(dǎo)入import命令常用參數(shù)

17-13利用Sqoop從MySQL中導(dǎo)入數(shù)據(jù)至HDFS

17-14Sqoop生成相應(yīng)Java代碼方法codegen

17-15利用Sqoop導(dǎo)入數(shù)據(jù)至Hive

17-16利用Sqoop導(dǎo)入數(shù)據(jù)至Hbase

17-17Sqoop導(dǎo)出功能介紹

17-18Sqoop數(shù)據(jù)導(dǎo)入export命令基本格式

17-19Sqoop數(shù)據(jù)導(dǎo)入export命令常用參數(shù)

17-20從HDFS中導(dǎo)出數(shù)據(jù)到MySQL

17-21從Hive導(dǎo)出數(shù)據(jù)到MySQL

17-22從Hbase導(dǎo)出數(shù)據(jù)到MySQL

18章分布式數(shù)據(jù)倉(cāng)庫(kù)Hbase

18-1分布式數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)

18-2No-SQL數(shù)據(jù)庫(kù)與面向列數(shù)據(jù)庫(kù)特性講解

18-3Hbase發(fā)展歷史

18-4Hbase核心特性

18-5Hbase在Linux中的安裝方法

18-6Hbase配置文件與修改方法

18-7Hbase與Zookeeper集成

18-8Hbase完全分布式安裝與運(yùn)行

18-9簡(jiǎn)單備份模式

18-10Hbase邏輯模型

18-11Hbase物理模型

18-12paxos算法與運(yùn)行機(jī)制

18-13靜態(tài)遷移與動(dòng)態(tài)遷移

18-14Hbase基本操作方法

18-15Hbase Shell通用命令General

18-16表格創(chuàng)建命令Create

18-17常用查看命令list、describe

18-18使用put命令添加數(shù)據(jù)

18-19刪除數(shù)據(jù)delete、delete all命令

18-20查看數(shù)據(jù)scan、get命令

18-21修改數(shù)據(jù)命令alter

18-22表格刪除方法

18-23其他統(tǒng)計(jì)方法

18-24Hbase和Hive集成概述

18-25Hbase和Hive集成方法

18-26使用HQL操作Hbase中數(shù)據(jù)

18-27Hbase和Spark集成概述

18-28Hbase和Spark集成方法

18-29利用Spark編程讀取Hbase中數(shù)據(jù)

19章數(shù)據(jù)倉(cāng)庫(kù)工具Hive

19-1數(shù)據(jù)倉(cāng)庫(kù)誕生背景與概念介紹

19-2常用數(shù)據(jù)倉(cāng)庫(kù)工具介紹

19-3分布式數(shù)據(jù)倉(cāng)庫(kù)工具介紹

19-4Hive核心特性

19-5Hive部署與訪問(wèn)

19-6Hive常用元數(shù)據(jù)服務(wù)與訪問(wèn)接口

19-7Hive數(shù)據(jù)模型

19-8數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)

19-9Hive API distinct

19-10Hive API multi insert

19-11Hive API union all

19-12Hive API union all

19-13Hive API group by&order by

19-14Hive基本數(shù)據(jù)類(lèi)型

19-15Hive復(fù)雜數(shù)據(jù)類(lèi)型

19-16Hive數(shù)據(jù)定義方法

19-17創(chuàng)建、修改和刪除表方法

19-18視圖和索引的創(chuàng)建、修改和刪除

19-19表中加載數(shù)據(jù)的方法

19-20表中導(dǎo)出數(shù)據(jù)方法

19-21查詢操作

19-22連接操作

19-23子查詢

19-24數(shù)據(jù)倉(cāng)庫(kù)企業(yè)開(kāi)發(fā)平臺(tái)

19-25數(shù)據(jù)倉(cāng)庫(kù)模型設(shè)計(jì)

19-26自助查詢系統(tǒng)設(shè)計(jì)

19-27寬表設(shè)計(jì)與用戶畫(huà)像

19-28利用Hive進(jìn)行網(wǎng)站流量分析

20章Spark基本原理與核心組件

20-1分布式計(jì)算框架介紹

20-2Spark誕生背景與發(fā)展歷程

20-3Spark基本定位與核心特性

20-4Scala語(yǔ)言介紹:基礎(chǔ)語(yǔ)法、編譯環(huán)境、常用類(lèi)型、聲明;行、字符、二進(jìn)制與文本文件的讀取與寫(xiě)入

20-5Scala 函數(shù):控制結(jié)構(gòu)(賦值、條件、循環(huán)、輸入輸出)與函數(shù)(參數(shù)與過(guò)程);數(shù)組操作(定義、遍歷、轉(zhuǎn)換)及常用算法

20-6Scala對(duì)象操作:的類(lèi)和對(duì)象構(gòu)造與繼承、重寫(xiě)、抽象、轉(zhuǎn)換;類(lèi)與對(duì)象中特質(zhì)的屬性與使用,包的使用與引入

20-7Spark運(yùn)行架構(gòu)

20-8Spark運(yùn)行基本流程

20-9RDD設(shè)計(jì)背景與基本概念

20-10RDD特性

20-11RDD之間依賴(lài)關(guān)系

20-12RDD運(yùn)行過(guò)程

20-13Spark三種部署方式

20-14Spark與Hadoop統(tǒng)一部署

20-15Spark結(jié)構(gòu)化數(shù)據(jù)模塊Spark SQL

20-16Spark機(jī)器學(xué)習(xí)算法庫(kù)Spark MLlib

20-17Spark流式計(jì)算框架Spark Streaming

20-18新一代Spark流式計(jì)算框架Structured Streaming

20-19Spark圖計(jì)算框架GraphX

21章PySpark編程

21-1RDD創(chuàng)建方法

21-2RDD轉(zhuǎn)換操作

21-3RDD行動(dòng)操作

21-4RDD惰性機(jī)制

21-5RDD持久化操作

21-6打印元素方法

21-7鍵值對(duì)RDD創(chuàng)建方法

21-8常用鍵值對(duì)轉(zhuǎn)換操作:reduceByKey、groupByKey、keys、values、sortByKey、mapValues、join等操作

21-9鍵值對(duì)RDD編程案例

21-10廣播變量

21-11累加器

21-*********.sql模塊

21-***************ming模塊

21-********k.ml模塊

21-***********llib模塊

21-***************Conf類(lèi)

21-******************text類(lèi)

21-****************iles類(lèi)

21-*********.RDD類(lèi)

21-*****************ator類(lèi)

21-***************cast類(lèi)

22章Spark SQL

22-1Spark SQL與shark

22-2Spark SQL基本設(shè)計(jì)結(jié)構(gòu)

22-3Spark SQL高級(jí)數(shù)據(jù)結(jié)構(gòu)

22-4高級(jí)數(shù)據(jù)結(jié)構(gòu)DataFrame概念介紹

22-5DataFrame與RDD

22-6DataFrame創(chuàng)建方法

22-7DataFrame常用操作

22-8利用RDD轉(zhuǎn)化生成DataFrame

22-9利用反射機(jī)制推斷RDD模式方法

22-10使用編程方式定義RDD模式

22-11常用外部數(shù)據(jù)源

22-12Parquet基本介紹

22-13讀寫(xiě)Parquet方法

22-14讀取MySQL中數(shù)據(jù)方法

22-15連接Hive讀寫(xiě)數(shù)據(jù)方法

23章Spark ML

23-1機(jī)器學(xué)習(xí)入門(mén)介紹:機(jī)器學(xué)習(xí)基本思想、常用算法分類(lèi)、算法庫(kù)等

23-2Spark機(jī)器學(xué)習(xí)包ML和MLlib介紹

23-3特征矩陣與標(biāo)簽數(shù)組

23-4評(píng)估器與解釋器

23-5特征工程概念介紹

23-6機(jī)器學(xué)習(xí)流概念介紹

23-7MLlib入門(mén)介紹

23-8MLlib向量的創(chuàng)建與使用,包括密集向量、稀疏向量、標(biāo)簽向量等

23-9MLlib矩陣的創(chuàng)建與使用,包括行矩陣、坐標(biāo)矩陣、本地矩陣等

23-10MLlib基本統(tǒng)計(jì)方法:概括統(tǒng)計(jì)、相關(guān)性、抽樣方法、假設(shè)檢驗(yàn)、核密度估計(jì)等

23-11降維操作:PCA主成分分析與SVD奇異值分解

23-12線性回歸分析

23-13邏輯歸回

23-14決策樹(shù)和隨機(jī)森林

23-15支持向量機(jī)SVM

23-16ML機(jī)器學(xué)習(xí)流創(chuàng)建方法

23-17特征抽取、轉(zhuǎn)化和選擇:TF-IDF、CountVectorizer、Word2Vec

23-18快速聚類(lèi)算法

23-19協(xié)同過(guò)濾算法

23-20集成算法

23-21反向傳播神經(jīng)網(wǎng)絡(luò)

23-22SVM支持向量機(jī)分類(lèi)和支持向量機(jī)回歸

24章Spark Streaming

24-1流式計(jì)算簡(jiǎn)介

24-2流式計(jì)算核心概念

24-3常用流式計(jì)算框架介紹

24-4Spark流式計(jì)算框架:Spark Streaming與Structured Streaming

24-5流式計(jì)算數(shù)據(jù)源介紹

24-6常用高級(jí)數(shù)據(jù)源

24-7分布式日志系統(tǒng)Flume介紹與安裝

24-8Flume使用方法

24-9分布式消息系統(tǒng)Kafka介紹與安裝

24-10Kafka使用方法

24-11Kafka和Flume集成

24-12Spark Streaming簡(jiǎn)介

24-13Spark Streaming計(jì)算框架基本架構(gòu)

24-14Dstream隊(duì)列流基本概念

24-15Spark Streaming與基本數(shù)據(jù)源集成:文件流、套接字流、RDD隊(duì)列流

24-16Spark Streaming與高級(jí)數(shù)據(jù)源集成:Kafka、Flume

24-17Dstream轉(zhuǎn)化操作與輸出操作

24-18Structured Streaming簡(jiǎn)介

24-19Structured Streaming基本架構(gòu)與計(jì)算流程

24-20DatazFrame創(chuàng)建與轉(zhuǎn)換

24-21利用Structured Streaming進(jìn)行流查詢

24-22通過(guò)編寫(xiě)?yīng)毩?yīng)用使用Structured Streaming

25章GraphX

25-1圖計(jì)算基本概念

25-2圖概念

25-3圖處理技術(shù),如圖數(shù)據(jù)庫(kù)、圖數(shù)據(jù)查詢、圖數(shù)據(jù)分析、圖數(shù)據(jù)可視化等

25-4圖計(jì)算軟件

25-5屬性圖概念

25-6屬性圖實(shí)例

25-7創(chuàng)建屬性圖方法

25-8graphx類(lèi)介紹

25-9使用RDD構(gòu)建圖

25-10查看操作列表

25-11屬性操作

25-12結(jié)構(gòu)操作

25-13關(guān)聯(lián)操作

25-14聚合操作

25-15緩存操作

25-16PageRank算法

25-17連通分支算法

25-18三角形計(jì)算算法

26章Flink流處理框架

26-1Flink的重要特點(diǎn)

26-2IDEA 集成開(kāi)發(fā)環(huán)境

26-3Java基礎(chǔ)及應(yīng)用:基礎(chǔ)語(yǔ)法、面向?qū)ο?、異常處理、IO流、注解、反射等

26-4Flink部署

26-5Flink運(yùn)行架構(gòu)

26-6Flink 流處理API

26-7Flink中的Window

26-8時(shí)間語(yǔ)義與Wartermark

26-9ProcessFunction API

26-10狀態(tài)編程和容錯(cuò)機(jī)制

26-11Table API 與SQL

26-12Flink CEP

27章大數(shù)據(jù)分析案例(三選二)

27-1數(shù)據(jù)采集平臺(tái)、數(shù)倉(cāng)、離線\\實(shí)時(shí)分析平臺(tái)設(shè)計(jì)、框架選型、搭建流程及常見(jiàn)問(wèn)題總結(jié)

27-2數(shù)據(jù)挖掘方法回顧

27-3CRISP-DM方法和SEMMA方法

27-4數(shù)據(jù)挖掘方法在大數(shù)據(jù)分析中的實(shí)踐應(yīng)用方法

27-5利用HDFS和Hbase進(jìn)行簡(jiǎn)單數(shù)據(jù)處理

27-6利用Sqoop完成數(shù)據(jù)ETL過(guò)程

27-7利用數(shù)據(jù)倉(cāng)庫(kù)工具和Spark SQL進(jìn)行數(shù)據(jù)清洗

27-8利用Spark MLlib構(gòu)建機(jī)器學(xué)習(xí)流進(jìn)行建模分析

27-9利用PyEcharts進(jìn)行結(jié)果可視化展示

27-10流量:用戶畫(huà)像與精細(xì)化營(yíng)銷(xiāo)

27-11產(chǎn)品:產(chǎn)品生命周期管理

27-12活動(dòng):KPI檢測(cè)體系構(gòu)建

27-13品牌:品類(lèi)管理與多位能力模型構(gòu)建

27-14客戶:客戶細(xì)分與用戶畫(huà)像

27-15產(chǎn)品:產(chǎn)品生命周期與用戶關(guān)系管理

27-16營(yíng)銷(xiāo):精準(zhǔn)營(yíng)銷(xiāo)、網(wǎng)絡(luò)獲客、客戶維護(hù)與客戶生命周期管理

27-17用戶離網(wǎng)分析

27-18客戶價(jià)值評(píng)估

27-19用戶細(xì)分

27-20電信反欺詐模型的構(gòu)建

學(xué)校介紹

數(shù)據(jù)分析師核心優(yōu)勢(shì)

   CDA數(shù)據(jù)分析師系統(tǒng)培訓(xùn)立足于數(shù)據(jù)分析領(lǐng)域教育事業(yè),覆蓋了國(guó)內(nèi)企業(yè)招聘數(shù)據(jù)分析師所要求的技能,進(jìn)一步提升數(shù)據(jù)分析師的職業(yè)素養(yǎng)與能力水平,促進(jìn)數(shù)據(jù)分析行業(yè)的高質(zhì)量持續(xù)快速發(fā)展。

數(shù)據(jù)分析師機(jī)構(gòu)簡(jiǎn)介

   經(jīng)管之家于2003年成立與中國(guó)人民大學(xué)經(jīng)濟(jì)學(xué)院,致力于推動(dòng)經(jīng)濟(jì)的進(jìn)步,傳播優(yōu)秀教育資源,目前已經(jīng)發(fā)展成為國(guó)內(nèi)大型的經(jīng)濟(jì)、管理、金融、統(tǒng)計(jì)類(lèi)的在線教育和咨詢網(wǎng)站,也是國(guó)內(nèi)*活躍和具影響力的經(jīng)管類(lèi)網(wǎng)絡(luò)社區(qū)。

    經(jīng)管之家運(yùn)營(yíng)團(tuán)隊(duì):北京國(guó)富如荷網(wǎng)絡(luò)科技有限公司,成立于2006年6月,公司以經(jīng)管之家為運(yùn)營(yíng)平臺(tái),經(jīng)營(yíng)業(yè)務(wù)包括培訓(xùn)業(yè)務(wù)、數(shù)據(jù)處理和分析服務(wù)和教輔產(chǎn)品等。經(jīng)管之家"數(shù)據(jù)分析培訓(xùn)中心" 自2007年成立以來(lái),致力于開(kāi)展統(tǒng)計(jì)軟件、數(shù)據(jù)分析和數(shù)據(jù)挖掘的培訓(xùn)與咨詢服務(wù),目前已有專(zhuān)家、講師團(tuán)隊(duì)100多位,擁有自主版權(quán)的視頻課程60多門(mén),每年開(kāi)設(shè)現(xiàn)場(chǎng)培訓(xùn)班100余場(chǎng),建立了完備的數(shù)據(jù)分析培訓(xùn)課程體系,每年培訓(xùn)學(xué)員3000多人。服務(wù)過(guò)的企業(yè)包括中國(guó)電子商務(wù)中心、招商銀行、中國(guó)人民銀行、中國(guó)郵政儲(chǔ)蓄、中國(guó)聯(lián)通、中國(guó)汽車(chē)技術(shù)研究中心、南京梅鋼等機(jī)構(gòu)。 

    發(fā)展至今,經(jīng)管之家"數(shù)據(jù)分析培訓(xùn)中心"已經(jīng)成為具有影響力和知名度的數(shù)據(jù)分析培訓(xùn)機(jī)構(gòu),我們一直努力做到:將數(shù)據(jù)分析變成一門(mén)常識(shí),讓統(tǒng)計(jì)軟件成為學(xué)術(shù)研究的好伙伴,企業(yè)經(jīng)營(yíng)的好軍師。

數(shù)據(jù)分析師學(xué)校優(yōu)勢(shì)

    CDA優(yōu)勢(shì)如何?

    2013年,經(jīng)管之家創(chuàng)立"CDA數(shù)據(jù)分析師"品牌,致力于為社會(huì)各界數(shù)據(jù)分析愛(ài)好者提供*優(yōu)質(zhì)、*科學(xué)、*系統(tǒng)的數(shù)據(jù)分析教育。截止2015年已成功舉辦40期系統(tǒng)培訓(xùn),培訓(xùn)學(xué)員達(dá)3千余名; 中國(guó)數(shù)據(jù)分析師俱樂(lè)部(CDA CLUB),已舉辦30期線下免費(fèi)沙龍活動(dòng),累積會(huì)員2千余名;中國(guó)數(shù)據(jù)分析師行業(yè)峰會(huì)(CDA Summit),一年兩次,參會(huì)人數(shù)達(dá)2千余名,在大數(shù)據(jù)領(lǐng)域影響力超前。"CDA數(shù)據(jù)分析師"隊(duì)伍在業(yè)界不斷壯大,對(duì)數(shù)據(jù)分析人才產(chǎn)業(yè)起到了巨大的推動(dòng)作用。

    優(yōu)勢(shì)一:師資與課程研發(fā)

    CDA數(shù)據(jù)分析師系統(tǒng)培訓(xùn),由經(jīng)管之家根據(jù)CDA認(rèn)證標(biāo)準(zhǔn)而設(shè)立的一套針對(duì)數(shù)據(jù)分析師技能的全面系統(tǒng)培訓(xùn)。培訓(xùn)師資目前來(lái)自學(xué)界、實(shí)務(wù)界相關(guān)領(lǐng)域的講師、教授、專(zhuān)家、工程師以及企業(yè)資深分析師,名師薈萃,代表了國(guó)內(nèi)數(shù)據(jù)分析培訓(xùn)的專(zhuān)業(yè)水平,可以更好地保證培訓(xùn)的學(xué)員既能學(xué)到扎實(shí)的數(shù)據(jù)分析理論知識(shí),又能具備較強(qiáng)的利用軟件解決實(shí)際問(wèn)題的能力,保證學(xué)員能勝任各行業(yè)數(shù)據(jù)分析師工作的要求。CDA數(shù)據(jù)分析師培訓(xùn)注重結(jié)合實(shí)際,把具技術(shù)含量、具價(jià)值理念的課程傳授給學(xué)員。課程還注重啟發(fā)式教學(xué),讓學(xué)員在動(dòng)手解決問(wèn)題中去學(xué)習(xí)。

     CDA數(shù)據(jù)分析師課程的大綱和內(nèi)容,既由經(jīng)管之家、CERTIFIED DATA ANALYST INSTITUTE(CDA協(xié)以及大數(shù)據(jù)、數(shù)據(jù)挖掘領(lǐng)域?qū)<覞撔拈_(kāi)發(fā)和反復(fù)研究,又經(jīng)過(guò)科學(xué)的調(diào)研確定,并且將不斷地隨著數(shù)據(jù)分析的市場(chǎng)需求和數(shù)據(jù)分析技術(shù)的發(fā)展而調(diào)整,課程內(nèi)容始終關(guān)注市場(chǎng)、關(guān)注前沿。課程內(nèi)容的設(shè)計(jì)更注重階梯化、體系化的原則,每一個(gè)學(xué)員,不論學(xué)習(xí)和工作的背景如何,都能在該課程體系中很快找到適合自己的課程,并不斷學(xué)習(xí)提高。

    優(yōu)勢(shì)二:繼續(xù)學(xué)習(xí)

    所有CDA學(xué)員除了學(xué)習(xí)現(xiàn)場(chǎng)課程之外,還會(huì)得到全程視頻錄像及輔助學(xué)習(xí)視頻課程(包括統(tǒng)計(jì)軟件、數(shù)據(jù)挖掘、大數(shù)據(jù)等內(nèi)容),此系列視頻課程可以進(jìn)行后期鞏固學(xué)習(xí)和進(jìn)修學(xué)習(xí),可扎實(shí)現(xiàn)學(xué)技能、拓展課余知識(shí)、升華技術(shù)層級(jí)。CDA數(shù)據(jù)分析師培訓(xùn)體系除了CDA LEVEL認(rèn)證培訓(xùn)以外,還推出了CDA就業(yè)脫產(chǎn)培訓(xùn),使跨行、跨專(zhuān)業(yè)的學(xué)生、待業(yè)人員能夠進(jìn)行全面的脫產(chǎn)集訓(xùn),并在培訓(xùn)后解決學(xué)員就業(yè),拿到高薪工作。除此之外,CDA還為有基礎(chǔ)的學(xué)員提供了更多元化更高級(jí)的行業(yè)專(zhuān)題培訓(xùn),包括*前沿的PYTHON、SPARK等工具,電商、金融、游戲等各行業(yè)專(zhuān)題,以及量化投資、CRM營(yíng)銷(xiāo)、臨床醫(yī)學(xué)等細(xì)分領(lǐng)域。

    優(yōu)勢(shì)三:在線學(xué)習(xí)

    Pe******et(就學(xué)教育)為CDA數(shù)據(jù)分析師在線學(xué)習(xí)平臺(tái)。視頻可實(shí)現(xiàn)隨時(shí)隨地在線聽(tīng)課,10分鐘一小節(jié),可進(jìn)行個(gè)性化、碎片化學(xué)習(xí),更具針對(duì)性與便利性。CDA上課方式分為現(xiàn)場(chǎng)及遠(yuǎn)程兩種方式,遠(yuǎn)程在線學(xué)習(xí)引進(jìn)了*新設(shè)備與技術(shù),與思科的合作解決了各地區(qū)學(xué)員的需求,實(shí)現(xiàn)了如同現(xiàn)場(chǎng)般的遠(yuǎn)程答疑及討論氛圍。

    優(yōu)勢(shì)四:人才認(rèn)證

    參與CDA培訓(xùn)學(xué)員可以參加一年兩次的"CDA數(shù)據(jù)分析師認(rèn)證考試",并獲得專(zhuān)業(yè)證書(shū)與持證人特權(quán)。CDA認(rèn)證考試目前有"LEVEL 1業(yè)務(wù)數(shù)據(jù)分析師","LEVEL 2建模分析師","LEVEL 2大數(shù)據(jù)分析師",考試由經(jīng)管之家主辦,通過(guò)者獲得經(jīng)管之家CDA認(rèn)證證書(shū),并可到臺(tái)灣申請(qǐng)由"中華資料采礦協(xié)會(huì)"頒發(fā)的"資料采礦分析師"證書(shū),亦可獲得由CDA協(xié)會(huì)認(rèn)證的"CERTIFIED DATA ANALYST CERTIFICATION"。

    優(yōu)勢(shì)五:CDA社群

    經(jīng)管之家有十二個(gè)社區(qū),七百個(gè)版塊,六百萬(wàn)會(huì)員。每日討論的熱點(diǎn)話題及資料以千計(jì)。學(xué)員在學(xué)后可以到"CDA數(shù)據(jù)分析師"版塊進(jìn)行交流、提問(wèn)、下載資料等,形成數(shù)據(jù)分析專(zhuān)業(yè)聚集地,促進(jìn)學(xué)員在圈子交流中高效發(fā)展。

    除了在線平臺(tái),中國(guó)數(shù)據(jù)分析師俱樂(lè)部(CDA CLUB)匯聚了數(shù)據(jù)分析領(lǐng)域的各界興趣愛(ài)好者,截止2015年已舉辦30期線下沙龍活動(dòng),會(huì)員累計(jì)2千余名,有高級(jí)會(huì)員與普通會(huì)員。在俱樂(lè)部中各會(huì)員可以通過(guò)共享資源方式獲得相應(yīng)積分,以積分兌換其他優(yōu)質(zhì)資源,形成了自發(fā)式的交流互動(dòng)。

    中國(guó)數(shù)據(jù)分析師行業(yè)峰會(huì)、大數(shù)據(jù)生態(tài)縱覽峰會(huì)(CDA SUMMIT)。一年兩次的行業(yè)峰會(huì),匯聚了國(guó)內(nèi)*的專(zhuān)家學(xué)者,發(fā)布前沿思想與技術(shù),參會(huì)人員上千名,盛世浩大,影響超前,為數(shù)據(jù)人才和大數(shù)據(jù)行業(yè)的發(fā)展起到了極大的推動(dòng)作用。

發(fā)展歷程:

"2006年 

開(kāi)展數(shù)據(jù)統(tǒng)計(jì)、計(jì)量實(shí)戰(zhàn),學(xué)術(shù)研究等相關(guān)培訓(xùn)視頻和現(xiàn)場(chǎng)班

2007年 

開(kāi)展數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)分析相關(guān)培訓(xùn)班

2011年 

隨著大數(shù)據(jù)熱潮的來(lái)臨,依托累計(jì)上萬(wàn)類(lèi)共享資料,多年沉淀師資團(tuán)隊(duì),論壇召集多位專(zhuān)家,研發(fā)CDA數(shù)據(jù)分析師體系

2013年

CDA數(shù)據(jù)分析師品牌成立,提供系統(tǒng)化的大數(shù)據(jù)、數(shù)據(jù)分析人才培養(yǎng)和認(rèn)證

2014年 

CDA INSTITUTE 成立 ,并推出第一屆全國(guó)CDA數(shù)據(jù)分析師認(rèn)證考試

2015年

第一屆中國(guó)數(shù)據(jù)分析師行業(yè)峰會(huì)(CDAS)在9月11日成功舉辦,參會(huì)人數(shù)逾3000人

2016年 

CDA匯聚海內(nèi)外大數(shù)據(jù)、數(shù)據(jù)分析專(zhuān)家上千人,推出就業(yè)班、數(shù)據(jù)科學(xué)家訓(xùn)練營(yíng)、企業(yè)內(nèi)訓(xùn)、CDA俱樂(lè)部等多個(gè)項(xiàng)目

2017年

整合論壇與CDA數(shù)據(jù)分析師業(yè)內(nèi)資源,形成數(shù)據(jù)分析領(lǐng)域生態(tài)圈,并進(jìn)一步升級(jí)CDA企業(yè)內(nèi)訓(xùn)體系,正式推出大數(shù)據(jù)實(shí)驗(yàn)室

2018年

北上廣深等多個(gè)城市均有校區(qū);擁有200多位專(zhuān)業(yè)師資;培養(yǎng)學(xué)員超過(guò)3萬(wàn)人,每年6月/12月全國(guó)28個(gè)城市舉辦CDA認(rèn)證考試

2019年

已舉辦九屆數(shù)據(jù)分析師認(rèn)證考試,得到業(yè)界廣泛認(rèn)可,學(xué)員遍布各大知名企業(yè)。人工智能產(chǎn)品“好學(xué)AI”問(wèn)世,引領(lǐng)DT時(shí)代新一波技術(shù)培訓(xùn)浪潮"

數(shù)據(jù)分析師師資力量


北京CDA數(shù)據(jù)分析師

  • 課程數(shù)量

    319

  • 分校數(shù)量

    3

  • 學(xué)員評(píng)價(jià)

    0

立即咨詢

精選推薦

北京軟件開(kāi)發(fā)培訓(xùn)

北京CDA数据分析师

北京大數(shù)據(jù)分析學(xué)習(xí)課程

北京CDA数据分析师

北京大數(shù)據(jù)培訓(xùn)分析

北京CDA数据分析师

CDA歐洲學(xué)校EMBA&數(shù)據(jù)分析碩士

北京CDA数据分析师

GrowingIO&CDA增長(zhǎng)黑客就業(yè)班

北京CDA数据分析师

AI 人工智能集訓(xùn)營(yíng)

北京CDA数据分析师

AI工程師

北京CDA数据分析师

CDA Python機(jī)器學(xué)習(xí)周末集訓(xùn)營(yíng)

北京CDA数据分析师

CDA人工智能就業(yè)班

北京CDA数据分析师

CDA區(qū)塊鏈就業(yè)班

北京CDA数据分析师

相關(guān)推薦