ML-10
- Agent–Environment interaction
- Reward systems and Markov Decision Processes (MDP)
- Q-learning (basics)
- Applications in robotics, games, optimization
یادگیری تقویتی – مقدماتی (Reinforcement Learning)
- تعامل عامل و محیط
- فرایند تصمیمگیری مارکوف (MDP)
- Q-Learning مقدماتی
- کاربردها در رباتیک، بازیها، بهینهسازی صنعتی