Artwork

เนื้อหาจัดทำโดย Marketech เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก Marketech หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
Player FM - แอป Podcast
ออฟไลน์ด้วยแอป Player FM !

Episode 02: Reinforcement Learning - Introduction

22:34
 
แบ่งปัน
 

Manage episode 454677662 series 2782204
เนื้อหาจัดทำโดย Marketech เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก Marketech หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

  continue reading

39 ตอน

Artwork
iconแบ่งปัน
 
Manage episode 454677662 series 2782204
เนื้อหาจัดทำโดย Marketech เนื้อหาพอดแคสต์ทั้งหมด รวมถึงตอน กราฟิก และคำอธิบายพอดแคสต์ได้รับการอัปโหลดและจัดหาให้โดยตรงจาก Marketech หรือพันธมิตรแพลตฟอร์มพอดแคสต์ของพวกเขา หากคุณเชื่อว่ามีบุคคลอื่นใช้งานที่มีลิขสิทธิ์ของคุณโดยไม่ได้รับอนุญาต คุณสามารถปฏิบัติตามขั้นตอนที่แสดงไว้ที่นี่ https://th.player.fm/legal
בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

  continue reading

39 ตอน

ทุกตอน

×
 
Loading …

ขอต้อนรับสู่ Player FM!

Player FM กำลังหาเว็บ

 

คู่มืออ้างอิงด่วน

ฟังรายการนี้ในขณะที่คุณสำรวจ
เล่น