Apache Airflow for Data Science: Automating Machine Learning Pipelines培訓
Apache Airflow 是一個開源平臺,用於編排工作流和自動化複雜的數據管道。
這種講師指導的現場培訓(在線或現場)面向希望自動化和管理機器學習工作流程的中級參與者,包括使用 Apache Airflow 進行模型訓練、驗證和部署。
在本次培訓結束時,參與者將能夠:
- 設置 Apache Airflow 用於機器學習工作流編排。
- 自動執行數據預處理、模型訓練和驗證任務。
- 將 Airflow 與機器學習框架和工具整合。
- 使用自動化管道部署機器學習模型。
- 監控和優化生產中的機器學習工作流程。
課程形式
- 互動講座和討論。
- 大量的練習和練習。
- 在即時實驗室環境中動手實施。
課程自定義選項
- 要申請本課程的定製培訓,請聯繫我們進行安排。
課程簡介
Machine Learning 的 Apache Airflow 簡介
- Apache Airflow 概述及其與數據科學的相關性
- 自動化機器學習工作流程的主要功能
- 為數據科學項目設置 Airflow
使用 Airflow 構建 Machine Learning 管道
- 為端到端ML工作流設計DAG
- 使用運算符進行數據攝取、預處理和特徵工程
- 計劃和管理管道依賴關係
模型訓練和驗證
- 使用 Airflow 自動執行模型訓練任務
- 將 Airflow 與 ML 框架集成(例如 TensorFlow、PyTorch)
- 驗證模型並存儲評估指標
模型部署和監控
- 使用自動化管道部署機器學習模型
- 使用 Airflow 任務監控已部署的模型
- 處理重新訓練和模型更新
高級定製和整合
- 為 ML 特定任務開發自訂運算元
- 將 Airflow 與雲平臺和 ML 服務整合
- 使用外掛程式和感測器擴展 Airflow 工作流
優化和擴展 ML 管道
- 提高大規模數據的工作流性能
- 使用 Celery 和 Kubernetes 擴展 Airflow 部署
- 生產級 ML 工作流的最佳實踐
案例研究和實際應用
- 使用 Airflow 實現 ML 自動化的真實範例
- 動手練習:構建端到端ML管道
- 討論 ML 工作流管理中的挑戰和解決方案
總結和後續步驟
最低要求
- 熟悉機器學習工作流程和概念
- 對 Apache Airflow 有基本的瞭解,包括 DAG 和運算符
- 熟練掌握 Python 程式設計
觀眾
- 數據科學家
- 機器學習工程師
- AI 開發人員
需要幫助選擇合適的課程嗎?
Apache Airflow for Data Science: Automating Machine Learning Pipelines培訓 - Enquiry
相關課程
AdaBoost Python for Machine Learning
14 時間:這種由 講師指導的 澳門 現場培訓(在線或現場)面向希望使用 AdaBoost 構建機器學習提升演算法的數據科學家和軟體工程師 Python。
在本次培訓結束時,參與者將能夠:
- 設置必要的開發環境,開始使用 AdaBoost 構建機器學習模型。
- 瞭解集成學習方法以及如何實現自適應提升。
- 在 Python 中瞭解如何構建 AdaBoost 模型來提升機器學習演算法。
- 使用超參數優化來提高 AdaBoost 模型的準確性和性能。
Anaconda Ecosystem for Data Scientists
14 時間:這種由 講師指導的 澳門 現場培訓(在線或現場)面向希望使用 Anaconda 生態系統在單一平臺中捕獲、管理和部署軟體包和數據分析工作流 的數據科學家。
在本次培訓結束時,參與者將能夠:
- 安裝和配置 Anaconda 個元件和庫。
- 瞭解 Anaconda 的核心概念、功能和優勢。
- 使用 Anaconda Navigator 管理包、環境和頻道。
- 將 Conda、R 和 Python 包用於數據科學和機器學習。
- 瞭解管理多個數據環境的一些實際使用案例和技術。
AutoML with Auto-Keras
14 時間:這種由 澳門 的講師指導式現場培訓(在線或現場)面向數據科學家以及希望使用 Auto-Keras 來自動化選擇和優化機器學習模型過程的技術人員。
在本次培訓結束時,參與者將能夠:
- 自動執行高效機器學習模型的訓練過程。
- 自動搜索深度學習模型的最佳參數。
- 構建高度準確的機器學習模型。
- 利用機器學習的強大功能解決實際業務問題。
AutoML
14 時間:這種由講師指導的 澳門 現場培訓(在線或現場)面向具有機器學習背景的技術人員,他們希望優化用於檢測大數據中複雜模式的機器學習模型。
在本次培訓結束時,參與者將能夠:
- 安裝和評估各種開源 AutoML 工具(H2O AutoML、auto-sklearn、TPOT、TensorFlow、PyTorch、Auto-Keras、TPOT、Auto-WEKA 等)
- 訓練高品質的機器學習模型。
- 高效解決不同類型的監督式機器學習問題。
- 只需編寫必要的代碼即可啟動自動化機器學習過程。
Creating Custom Chatbots with Google AutoML
14 時間:這種以講師為主導的澳門(在線或現場)現場培訓面向具有不同專業水平的參與者,他們希望利用 Google 的 AutoML 平臺為各種應用程式構建定製的聊天機器人。
在培訓結束時,參與者將能夠:
- 瞭解聊天機器人開發的基礎知識。
- 流覽 Google 雲平臺並訪問 AutoML。
- 為訓練聊天機器人模型準備數據。
- 使用 AutoML 訓練和評估自定義聊天機器人模型。
- 將聊天機器人部署並整合到各種平台和管道中。
- 隨時間推移監控和優化聊天機器人性能。
DataRobot
7 時間:這種由 講師指導的 澳門 現場培訓(在線或現場)面向希望使用 DataRobot 的機器學習功能自動化、評估和管理預測模型的數據科學家和數據分析師。
在本次培訓結束時,參與者將能夠:
- 在 DataRobot 中載入數據集以分析、評估和品質檢查數據。
- 構建和訓練模型以識別重要變數並滿足預測目標。
- 解釋模型以創建有助於做出業務決策的寶貴見解。
- 監控和管理模型以保持優化的預測性能。
Data Mining with Weka
14 時間:此講師指導的 澳門 現場培訓(在線或現場)面向希望使用 Weka 執行數據挖掘任務的初級到 中級數據分析師和數據科學家。
在本次培訓結束時,參與者將能夠:
- 安裝並配置 Weka。
- 瞭解 Weka 環境和工作臺。
- 使用 Weka 執行數據挖掘任務。
Google Cloud AutoML
7 時間:這種講師指導的 澳門 現場培訓(在線或現場)面向數據科學家、數據分析師和開發人員,他們希望探索 AutoML 產品和功能,以最少的工作量創建和部署自定義 ML 訓練模型。
在本次培訓結束時,參與者將能夠:
- 探索 AutoML 產品線,為各種數據類型實施不同的服務。
- 準備和標記數據集以創建自定義 ML 模型。
- 訓練和管理模型以生成準確、公平的機器學習模型。
- 使用經過訓練的模型進行預測,以滿足業務目標和需求。
Kaggle
14 時間:這個由 講師指導的 澳門 現場培訓(在線或現場)面向希望在 Data Science 中使用 Kaggle 學習和建立職業生涯的數據科學家和開發人員。
在本次培訓結束時,參與者將能夠:
- 了解數據科學和機器學習。
- 探索數據分析。
- 瞭解 Kaggle 及其工作原理。
Machine Learning for Mobile Apps using Google’s ML Kit
14 時間:這種由講師指導的現場培訓(在線或現場)面向希望使用 Google ML Kit 構建針對行動裝置上的處理進行了優化的機器學習模型的開發人員。
在本次培訓結束時,參與者將能夠:
- 設置必要的開發環境以開始為行動應用程式開發機器學習功能。
- 使用 ML Kit API 將新的機器學習技術集成到 Android 和 iOS 應用程式中。
- 使用 ML Kit SDK 增強和優化現有應用程式,以進行設備上的處理和部署。
Accelerating Python Pandas Workflows with Modin
14 時間:這種由 講師指導的 澳門 現場現場培訓(在線或現場)面向希望使用 Modin 構建和實施並行計算的數據科學家和開發人員 Pandas 以加快數據分析速度。
在本次培訓結束時,參與者將能夠:
- 設置必要的環境,開始使用 Modin 大規模開發 Pandas 工作流。
- 瞭解 Modin 的功能、架構和優勢。
- 瞭解 Modin、Dask 和 Ray 之間的區別。
- 使用 Modin 更快地執行 Pandas 操作。
- 實現整個 Pandas API 和函數。
Machine Learning with Random Forest
14 時間:這種由 澳門 的講師指導式實時培訓(在線或現場)面向希望使用 Random Forest 為大型數據集構建機器學習演算法的數據科學家和軟體工程師。
在本次培訓結束時,參與者將能夠:
- 設置必要的開發環境,開始使用 Random forest 構建機器學習模型。
- 瞭解 Random Forest 的優點以及如何實施它來解決分類和回歸問題。
- 在 Random Forest 中瞭解如何處理大型數據集和解釋多個決策樹。
- 通過優化超參數來評估和優化機器學習模型的性能。
Advanced Analytics with RapidMiner
14 時間:此講師指導的 澳門 現場培訓(在線或現場)面向 希望學習如何使用 RapidMiner 估計和預測值並利用分析工具進行時間序列預測的中級數據分析師。
在本次培訓結束時,參與者將能夠:
- 學習應用 CRISP-DM 方法,選擇合適的機器學習演算法,並增強模型構建和性能。
- 使用 RapidMiner 估計和預測值,並利用分析工具進行時間序列預測。
RapidMiner for Machine Learning and Predictive Analytics
14 時間:RapidMiner 是一個開源數據科學軟體平臺,用於快速應用程式原型設計和開發。它包括用於數據準備、機器學習、深度學習、文本挖掘和預測分析的集成環境。
在這個由講師指導的實時培訓中,參與者將學習如何使用 RapidMiner Studio 進行數據準備、機器學習和預測模型部署。
在本次培訓結束時,參與者將能夠:
- 安裝與設定RapidMiner
- 使用 RapidMiner 準備和可視化數據
- 驗證機器學習模型
- 混搭數據並創建預測模型
- 在業務流程中實施預測分析
- 故障排除和優化 RapidMiner
觀眾
- 數據科學家
- 工程師
- 開發人員
課程形式
- 部分講座、部分討論、練習和大量動手實踐
注意
- 要申請本課程的定製培訓,請聯繫我們進行安排。
GPU Data Science with NVIDIA RAPIDS
14 時間:這種以講師為主導的澳門現場培訓(現場或遠端)針對希望使用RAPIDS構建GPU加速數據管道,工作流和可視化的數據科學家和開發人員,應用機器學習演算法,如XGBoost,cuML等。
在培訓結束時,參與者將能夠:
- 設置必要的開發環境以使用 NVIDIA RAPIDS 構建數據模型。
- 瞭解 RAPIDS 的特性、元件和優勢。
- 利用 GPU 加速端到端數據和分析管道。
- 使用 cuDF 和 Apache Arrow 實現 GPU 加速的數據準備和 ETL。
- 瞭解如何使用 XGBoost 和 cuML 演算法執行機器學習任務。
- 使用 cuXfilter 和 cuGraph 構建數據可視化並執行圖形分析。