Google Cloud Platform Fundamentals: Big Data & Machine Learning
|
Google Cloud Platform 大數據暨機器學習基礎課程
課程代碼
GCP-FUN-BIGDATA
課程天數
1 天
課程概要
介紹Google Cloud Platform 的大數據功能。通過講師講解,演示和學員動手實驗的全方位學習,學員可以從概觀以至於細部了解Google 雲平台以及數據處理和機器學習功能。藉此了解Google 雲平台上大數據解決方案的易用,彈性和強大功能。
學習目標和取得技能
- 認識Google Cloud Platform 中主要大數據和機器學習工具之使用目的和價值
- 使用Cloud SQL 和Cloud Dataproc 將現有的MySQL 和Hadoop / Pig / Spark/ Hive 工作負載遷移到Google Cloud Platform
- 使用BigQuery 和Cloud Datalab 進行交互式數據分析
- 以TensorFlow 來訓練和操作神經網絡
- 操作各項簡易上手的ML API
- 自Google Cloud Platform 眾多數據處理產品中選擇適當工具協助處理任務
教學方式
Google認證講師課堂中文指導
教材與實驗
Google原廠教材與Qwiklabs實驗室
課程適合對象
- 數據分析師,數據科學家,商業分析師等,初接觸GCP 的使用者
- 負責設計數據處理的流程和架構、創建和維護機器學習及統計模型的人員;操作和查詢數據集、將查詢結果視覺化和創建數據分析報告的人員
- 管理階層和IT 決策者等,正在評估導入GCP 以供企業內數據科學家使用者
前備知識
- 熟悉常用資料庫,如SQL 的基礎語法
- 曾有數據建模、提取、轉換,和加載數據運行的經驗
- 可使用Python 等程式語言開發應用程序
- 熟悉機器學習和/或統計
課程大綱
課程包括課堂講解,演示和學員實作實驗
Module 1:介紹Google Cloud Platform
主題 |
實驗 |
Google 平台基礎知識概述 |
-- |
Google 雲端平台大數據產品 |
-- |
Module 2:計算和存儲基礎
主題 |
實驗 |
Compute Engine 可彈性擴充的高效VM (CPUs) |
-- |
Cloud Storage 搭載全球邊緣快取技術的 物件儲存空間 |
-- |
CloudShell 適用任何瀏覽器的指令列管理功能 |
Set up a Ingest-Transform-Publish data processing pipeline |
Module 3:雲上的數據分析
主題 |
實驗 |
簡介雲上的數據分析 |
-- |
Cloud SQL:雲上的SQL 數據庫 |
Importing data into CloudSQL and running queries |
Spark on Dataproc 代管服務 |
Machine Learning Recommendations with Spark on Dataproc |
Module 4:擴充數據分析功能
主題 |
實驗 |
快速隨機訪問 |
-- |
探索、分析並以視覺化方式呈現大型資料集的Datalab |
-- |
內建機器學習技術的全代管資料倉儲服務,且具高擴充性的BigQuery |
Build machine learning dataset |
Module 5:機器學習
主題 |
實驗 |
TensorFlow 與機器學習 |
Carry out ML with TensorFlow |
針對常見需求預建的可用模型 |
Employ ML APIs |
Module 6:數據處理架構
主題 |
實驗 |
Pub / Sub 訊息導向的事件串流架構 |
-- |
使用Dataflow 創建數據處理管道 |
-- |
即時和批量數據處理的架構 |
-- |
Module 7:總結
主題 |
實驗 |
為何選擇GCP |
-- |
下㇐步行動 |
-- |
其他資源 |
-- |
推薦課程