Fundamentals of Reinforcement Learning培訓

Reinforcement Learning （RL）是一種機器學習技術，其中計算機程式（代理）通過執行操作並接收有關操作結果的反饋來學習在環境中的行為。對於每個好的動作，代理都會收到積極的反饋，而對於每個壞的動作，代理都會收到負面反饋（懲罰）。

這種由講師指導的現場培訓（在線或現場）面向數據科學家，他們希望超越傳統的機器學習方法，在不使用標記數據和大數據集的情況下教授計算機程式來解決問題。

在本次培訓結束時，參與者將能夠：

安裝並應用實現 Reinforcement Learning 所需的庫和程式設計語言。
創建一個能夠通過反饋而不是通過監督學習來學習的軟體代理。
對代理程式進行程式設計，以解決決策順序和有限的問題。
將知識應用於設計軟體，該軟體可以以類似於人類學習的方式進行學習。

課程形式

互動講座和討論。
大量的練習和練習。
在即時實驗室環境中動手實施。

課程自定義選項

要申請本課程的定製培訓，請聯繫我們進行安排。

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

課程簡介

介紹

通過正強化學習

Elements 的 Reinforcement Learning

重要術語（操作、狀態、獎勵、政策、價值、Q 值等）

表格解決方案方法概述

創建 Software Agent

瞭解基於價值、基於策略和基於模型的方法

使用 Markov 決策過程（MDP）

策略如何定義代理的行為方式

使用 Monte Carlo 方法

時間差異學習

n 步 Bootstrapping

近似求解方法

使用近似值進行策略預測

使用近似的策略控制

使用近似的非策略方法

了解資格跟蹤

使用策略梯度方法

總結和結論

最低要求

機器學習經驗
Programming 經驗

觀眾

數據科學家

21 時間：

需要幫助選擇合適的課程嗎？

Deep Reinforcement Learning with Python

21 時間：

Large Language Models (LLMs) and Reinforcement Learning (RL)

21 時間：

Reinforcement Learning with Google Colab

28 時間：

Fundamentals of Reinforcement Learning培訓

課程簡介

最低要求

課程分類

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Fundamentals of Reinforcement Learning培訓

課程簡介

最低要求

相關課程

Deep Reinforcement Learning with Python

Large Language Models (LLMs) and Reinforcement Learning (RL)

Reinforcement Learning with Google Colab

課程分類

Reinforcement Learning

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites