,

On Proximal Policy Optimization's Heavy-tailed Gradients.

, , , , , , , , и .
ICML, том 139 из Proceedings of Machine Learning Research, стр. 3610-3619. PMLR, (2021)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии