Образовательный центр VK в МГУ

Обучение с подкреплением часть 1

Лекция: Основные понятия обучения с подкреплением: агент, среда, стратегия, награда. Value function и Q-function. Уравнения Беллмана. Алгоритм Policy iteration. (Слайды, Видео)
Семинар: Реализация агента для прохождения игры. (Семинар)

Даниил Полыковский

Другие видеозаписи

Hadoop
Лекция №14
СУБД в интернет-приложениях
Смешанное занятие №1
Тестирование
Смешанное занятие №4
Системное программирование на Perl
Демонизация

Все видео

Обратная связь

Присоединяйся:

Группа VK

Разработка:
Команда
VK Education

Версия портала - 5.91.7

Обучение с подкреплением 1

Обучение с подкреплением часть 1