Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
介紹
- 雲計算和大數據解決方案簡介
- Apache 概述 Hadoop 特性和體系結構
設定Hadoop
- 規劃 Hadoop 集群(本地、雲等)
- 選擇操作系統和 Hadoop 發行版
- 預配資源(硬體、網路等)
- 下載和安裝軟體
- 調整群集大小以實現靈活性
使用 HDFS
- 瞭解 Hadoop 分散式文件系統 (HDFS)
- HDFS命令參考概述
- 訪問 HDFS
- 在HDFS上執行基本檔操作
- 使用 S3 作為 HDFS 的補充
MapReduce概述
- 瞭解MapReduce框架中的數據流
- 映射、隨機播放、排序和減少
- 演示:計算最高工資
使用 YARN
- 瞭解 Hadoop 中的資源管理
- 使用 ResourceManager、NodeManager、Application Master
- 在 YARN 下調度作業
- 為大量節點和集群進行調度
- 演示:作業調度
將 Hadoop 與 Spark 集成
- 為 Spark 設置存儲(HDFS、Amazon、S3、NoSQL 等)
- 瞭解彈性分散式資料集 (RDD)
- 創建 RDD
- 實現 RDD 轉換
- 演示:實現電影標題的文本搜索程式
管理 Hadoop 集群
- 監控 Hadoop
- 保護 Hadoop 集群
- 添加和刪除節點
- 運行性能基準
- 調整 Hadoop 群集以優化性能
- 備份、恢復和業務連續性規劃
- 確保高可用性 (HA)
升級和遷移 Hadoop 集群
- 評估工作負載要求
- 升級 Hadoop
- 從本地遷移到雲,反之亦然
- 從故障中恢復
故障排除
總結和結論
最低要求
- 系統管理經驗
- 具有 Linux 命令行的經驗
- 對大數據概念的理解
觀眾
- 系統管理員
- 資料庫管理員
35 時間:
客戶評論 (5)
很多實際的例子,處理同一問題的不同方法,有時還不那麼明顯的技巧如何改進當前的解決方案
Rafal - Nordea
Course - Apache Spark MLlib
機器翻譯
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift