課程簡介

Apache Kylin 簡介

  • OLAP 概述及其在大數據分析中的重要性
  • Apache Kylin 的演進與架構
  • Kylin 50 的主要功能與特性

設置 Apache Kylin

  • 安裝前提與環境設置
  • 使用 Hadoop、Spark 和 Kafka 配置 Kylin
  • 了解 Kylin 的 Web UI 和命令行工具

Kylin 中的數據建模

  • 為 OLAP 立方體設計星型與雪花型模式
  • 定義維度與度量
  • 在 Kylin 的 Web UI 中創建與管理數據模型

構建與管理立方體

  • 立方體構建過程與作業管理
  • 增量構建與自動合併策略
  • 監控立方體健康狀況與性能

Kylin 的實時串流處理

  • 整合 Kafka 作為串流數據源
  • 設置實時立方體與融合模型
  • 實現串流數據的低延遲分析

查詢與分析

  • 使用 Kylin 的查詢介面執行 SQL 查詢
  • 將 BI 工具(例如 Tableau、Power BI)連接到 Kylin
  • 執行多維度分析與下鑽操作

性能優化

  • 立方體設計與聚合的最佳實踐
  • 資源管理與可擴展性調優
  • 排查常見性能問題

進階主題

  • Kylin 中的安全性與訪問控制
  • 使用自定義插件與集成擴展 Kylin
  • 探索 Kylin 的 REST API 以實現自動化

總結與下一步

最低要求

  • 了解Hadoop和大数据生态系统
  • 熟悉SQL和数据仓库概念
  • 具备Kafka等流数据平台的基础知识

受众

  • 希望实施实时分析解决方案的大数据工程师
  • 旨在利用OLAP功能处理大型数据集的数据分析师
  • 对现代化基础设施感兴趣的数据仓库架构师
 14 時間:

客戶評論 (5)

課程分類