- Регистрация
- 30 Дек 2021
- Сообщения
- 45,854
- Реакции
- 41
- Баллы
- 48
Посмотреть вложение 858000
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и...
Обучение с подкреплением для реальных задач [Фил Уиндер]
Скачать:
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и...
Обучение с подкреплением для реальных задач [Фил Уиндер]
Скачать:
Для просмотра скрытого содержимого необходимо Войти или Зарегистрироваться