,

On Proximal Policy Optimization's Heavy-tailed Gradients.

S. Garg, J. Zhanson, E. Parisotto, A. Prasad, J. Kolter, Z. Lipton, S. Balakrishnan, R. Salakhutdinov, и P. Ravikumar.
ICML, том 139 из Proceedings of Machine Learning Research, стр. 3610-3619. PMLR, (2021)

Метаданные

ключ BibTeX: conf/icml/GargZPPKLBSR21
тип записи: inproceedings
название книги: ICML
год: 2021
страницы: 3610-3619
издательство: PMLR
серии: Proceedings of Machine Learning Research
том: 139
Перекрестная ссылка BibTeX: conf/icml/2021
ee: http://proceedings.mlr.press/v139/garg21b.html
url: http://dblp.uni-trier.de/db/conf/icml/icml2021.html#GargZPPKLBSR21

тэги

dblp

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

Цитировать эту публикацию

искать в

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter