,

Provably Efficient Iterated CVaR Reinforcement Learning with Function Approximation and Human Feedback.

Y. Chen, Y. Du, P. Hu, S. Wang, D. Wu, и L. Huang.
ICLR, OpenReview.net, (2024)

Метаданные

ключ BibTeX: conf/iclr/ChenDH0WH24
тип записи: inproceedings
название книги: ICLR
год: 2024
издательство: OpenReview.net
Перекрестная ссылка BibTeX: conf/iclr/2024
ee: https://openreview.net/forum?id=vW1SkPl4kp
url: http://dblp.uni-trier.de/db/conf/iclr/iclr2024.html#ChenDH0WH24

тэги

dblp

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

Цитировать эту публикацию

искать в

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter