,

OPIRL: Sample Efficient Off-Policy Inverse Reinforcement Learning via Distribution Matching.

H. Hoshino, K. Ota, A. Kanezaki, и R. Yokota.
ICRA, стр. 448-454. IEEE, (2022)

Метаданные

ключ BibTeX: conf/icra/HoshinoOKY22
тип записи: inproceedings
название книги: ICRA
год: 2022
страницы: 448-454
издательство: IEEE
Перекрестная ссылка BibTeX: conf/icra/2022
ee: https://doi.org/10.1109/ICRA46639.2022.9811660
isbn: 978-1-7281-9681-7
url: http://dblp.uni-trier.de/db/conf/icra/icra2022.html#HoshinoOKY22

тэги

dblp

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

Цитировать эту публикацию

искать в

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter