ПРИМЕНЕНИЕ ТРАНСФОРМЕРА ДЛЯ КОДИРОВАНИЯ СОСТОЯНИЙ В ОБУЧЕНИИ С ПОДКРЕПЛЕНИЕМ
Д.А. Козлов
Самарский национальный исследовательский университет им. академика С. П. Королёва, Самара, Россия djoade100@gmail.com
Ключевые слова: обучение с подкреплением, трансформер, SAC
Страницы: 60-68
Аннотация
Исследуется применение архитектуры трансформера для кодирования состояний в алгоритмах обучения с подкреплением. Представлен новый подход, который интегрирует трансформеры с существующими методами, такими как SAC (Soft Actor-Critic), для улучшения их производительности и обобщающей способности. Результаты экспериментальных исследований показывают, что предложенный подход может улучшить обучение в сложных задачах приобретения навыков передвижения в трёхмерном пространстве.
DOI: 10.15372/AUT20240507 |