Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
介紹
- 了解數據準備在分析和機器學習中的重要性
- 數據準備管道及其在數據生命週期中的作用
- 探索原始數據中的常見挑戰及其對分析的影響
數據收集和獲取
- 數據源:資料庫、API、電子錶格、文本檔等
- 收集數據和確保收集過程中數據質量的技術
- 從各種來源收集數據
Data Cleaning 技術
- 識別和處理缺失值、異常值和不一致
- 處理數據集中的重複項和錯誤
- 清理真實世界的數據集
數據轉換和標準化
- 數據規範化和標準化技術
- 分類數據處理:編碼、分箱和特徵工程
- 將原始資料轉換為可用格式
Data Integration 和聚合
- 合併和組合來自不同來源的數據集
- 解決數據衝突並調整數據類型
- 數據聚合和整合技術
Data Quality 保險
- 在整個過程中確保數據品質和完整性的方法
- 實施品質檢查和驗證程式
- 數據質量保證的案例研究和實際應用
降維和特徵選擇
- 瞭解降維的必要性
- PCA、特徵選擇和約簡策略等技術
- 實施降維技術
摘要和後續步驟
最低要求
-
基本了解數據概念
觀眾
-
數據分析師
Database 管理員
IT 專業人員
14 時間:
客戶評論 (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Course - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.