Обучение с подкреплением 1

Обучение с подкреплением часть 1

Лекция: Основные понятия обучения с подкреплением: агент, среда, стратегия, награда. Value function и Q-function. Уравнения Беллмана. Алгоритм Policy iteration. (Слайды, Видео)
Семинар: Реализация агента для прохождения игры. (Семинар)

  • Даниил Полыковский Даниил Полыковский
Другие видеозаписи
Все видео

© VK, 2011–2025

Обратная связь

Присоединяйся:

Группа VK
  • Разработка:
    Команда
    VK Education
Версия портала - 5.86.4