課程介紹

華為大數(shù)據(jù)專家(HCIE-Big Data)證定位華為大數(shù)據(jù)分析領(lǐng)域中大型分布式并行處理數(shù)據(jù)倉庫平臺(tái)的架構(gòu)原理、優(yōu)化設(shè)計(jì)、應(yīng)用開發(fā)和大數(shù)據(jù)挖掘領(lǐng)域的基礎(chǔ)理論、常用挖掘算法、應(yīng)用設(shè)計(jì)以及開發(fā)、旨在推動(dòng)業(yè)界大數(shù)據(jù)行業(yè)的專家型人才培養(yǎng)。主要內(nèi)容包括華為企業(yè)級(jí)的大型并行處理分布式數(shù)據(jù)倉庫平臺(tái)FusionInsight LibrA的架構(gòu)、功能特性、數(shù)據(jù)庫設(shè)計(jì)開發(fā);數(shù)據(jù)挖掘理論以及使用華為企業(yè)級(jí)大數(shù)據(jù)挖掘平臺(tái)FusionInsight Miner和基于華為云的企業(yè)智能平臺(tái)EI的基礎(chǔ)服務(wù)- MLS機(jī)器學(xué)習(xí)服務(wù)進(jìn)行數(shù)據(jù)深度分析和挖掘、通過華為HCIE-Big Data的學(xué)習(xí)、您將對(duì)大數(shù)據(jù)技術(shù)有更加深入的理解、具備運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行大數(shù)據(jù)分析應(yīng)用、大數(shù)據(jù)挖掘應(yīng)用的專家能力。

標(biāo)題圖標(biāo)學(xué)員基礎(chǔ)

學(xué)員應(yīng)了解大數(shù)據(jù)技術(shù)原理和Hadoop的基礎(chǔ)知識(shí),具備華為大數(shù)據(jù)HCNA水平,熟悉Linux的管理和操作、具有數(shù)據(jù)庫的基本知識(shí),有數(shù)據(jù)庫的使用經(jīng)驗(yàn),了解 SQL 語言。具備一定軟件開發(fā)能力,熟悉Java、Python, C++等至少一種開發(fā)語言。

標(biāo)題圖標(biāo)課程目標(biāo)

理解并掌握大型并行處理數(shù)據(jù)倉庫平臺(tái)的架構(gòu)原理、分布式關(guān)系型數(shù)據(jù)庫的設(shè)計(jì)和優(yōu)化及應(yīng)用開發(fā);掌握大數(shù)據(jù)挖掘的基本原理,常用算法、常用挖掘方法、對(duì)華為大數(shù)據(jù)挖掘解決方案FusionInsight Miner和華為云機(jī)器學(xué)習(xí)服務(wù)MLS的熟練使用,勝任數(shù)據(jù)倉庫開發(fā)、大數(shù)據(jù)分析、大數(shù)據(jù)數(shù)據(jù)挖掘和人工智能的相關(guān)崗位。

課程大綱

第一章 數(shù)據(jù)倉庫平臺(tái)FusionInsight LibrA

理論

第一節(jié) 分布式數(shù)據(jù)庫架構(gòu)

體系架構(gòu)基本知識(shí)

熟悉MPP架構(gòu)及優(yōu)勢(shì)

業(yè)界產(chǎn)品說明

第二節(jié) FusionInsight LibrA 基本組件簡(jiǎn)介

LibrA邏輯架構(gòu)

LibrA物理架構(gòu)

LibrA數(shù)據(jù)庫對(duì)象

第三節(jié) FusionInsight LibrA 產(chǎn)品特性和關(guān)鍵技術(shù)

架構(gòu)和支持的操作系統(tǒng)

面向應(yīng)用開發(fā)的基本功能

數(shù)據(jù)庫安全

圖形化工具

高級(jí)特性

第四節(jié) FusionInsight LibrA 配套工具集

Database Manager概念與架構(gòu)

Database Manager的安裝

Database Manager的使用

Data Studio概念與架構(gòu)

Data Studio的安裝與FusionInsight LibrA服務(wù)器的配置

Data Studio工具支持的特性

Data Studio的使用

第五節(jié) FusionInsight LibrA 安全管理

訪問控制

用戶管理

權(quán)限管理模型

對(duì)象權(quán)限

安全審計(jì)

第六節(jié) FusionInsight LibrA 數(shù)據(jù)庫管理系統(tǒng)并發(fā)控制

配置負(fù)載均衡

事務(wù)與隔離

LibrA鎖機(jī)制介紹

第七節(jié) FusionInsight LibrA 數(shù)據(jù)庫性能監(jiān)控

系統(tǒng)資源監(jiān)控方式

性能相關(guān)視圖

使用命令行監(jiān)控集群性能

使用DM工具監(jiān)控集群性能

第八節(jié) FusionInsight LibrA 數(shù)據(jù)遷移

數(shù)據(jù)遷移場(chǎng)景劃分

GDS工具適用場(chǎng)景和使用方法

copy from/to適用場(chǎng)景和使用方法

開源ELT工具適用場(chǎng)景和使用方法

gs_dump/gs_restore適用場(chǎng)景和使用方法

gsql工具適用場(chǎng)景和使用方法

Roach工具適用場(chǎng)景和使用方法

從其他數(shù)據(jù)庫中遷移數(shù)據(jù)

第九節(jié) FusionInsight LibrA SQL介紹

SQL相關(guān)機(jī)制和原理

利用EXPLAIN進(jìn)行SQL調(diào)優(yōu)

第十節(jié) FusionInsight LibrA 數(shù)據(jù)庫設(shè)計(jì)

數(shù)據(jù)庫邏輯設(shè)計(jì)

存儲(chǔ)模式

數(shù)據(jù)分布

表分區(qū)

索引

第十一節(jié) FusionInsight LibrA 應(yīng)用程序開發(fā)指導(dǎo)

FusionInsight LibrA驅(qū)動(dòng)介紹

ODBC應(yīng)用程序開發(fā)

JDBC應(yīng)用程序開發(fā)

基礎(chǔ)開發(fā)規(guī)范

第二章 FusionInsight LibrA實(shí)驗(yàn)

FusionInsight LibrA基本操作、語法

FusionInsight LibrA性能優(yōu)化

網(wǎng)絡(luò)KPI數(shù)據(jù)柵格化處理

重點(diǎn)區(qū)域數(shù)據(jù)分析

流動(dòng)人口常駐地分析

第三章 大數(shù)據(jù)挖掘理論

第一節(jié) 預(yù)備知識(shí)和數(shù)據(jù)介紹

數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘的流程

數(shù)據(jù)挖掘的應(yīng)用

數(shù)據(jù)和屬性類型

數(shù)據(jù)的統(tǒng)計(jì)描述

數(shù)據(jù)的鄰近性度量

第二節(jié) 數(shù)據(jù)預(yù)處理

為什么要預(yù)處理數(shù)據(jù)

數(shù)據(jù)清理

數(shù)據(jù)集成

數(shù)據(jù)歸約

數(shù)據(jù)變換

第三節(jié) 數(shù)據(jù)倉庫介紹

數(shù)據(jù)倉庫的概念

數(shù)據(jù)倉庫的體系結(jié)構(gòu)與模型

多維數(shù)據(jù)模型

概念分層

OLAP與OLTP

方體物化

第四節(jié) 分類

分類和回歸的概念

決策樹分類

樸素貝葉斯分類

組合分類

后向傳播分類

支持向量機(jī)分類

模型評(píng)估與選擇

第五節(jié) 聚類

聚類的定義

K-均值算法

k-中心點(diǎn)算法

第六節(jié) 離群點(diǎn)檢測(cè)

離群點(diǎn)的概念

離群點(diǎn)檢測(cè)的方法

第七節(jié) 關(guān)聯(lián)規(guī)則(Association Rule)

關(guān)聯(lián)規(guī)則的定義

關(guān)聯(lián)規(guī)則挖掘步驟及相關(guān)概念

關(guān)聯(lián)規(guī)則挖掘方法分類

Apriori算法

第八節(jié) FusionInsight Miner 和華為云機(jī)器學(xué)習(xí)服務(wù)MLS

FusionInsight Miner整體介紹

關(guān)系分析

標(biāo)簽管理

華為云機(jī)器學(xué)習(xí)服務(wù)

第四章 大數(shù)據(jù)挖掘?qū)崙?zhàn)

銀行定期存款業(yè)務(wù)預(yù)測(cè)

客戶分群

鮑魚生長年齡預(yù)測(cè)

友情鏈接

Back to top