,

Preference-Based Policy Iteration: Leveraging Preference Learning for Reinforcement Learning.

W. Cheng, J. Fürnkranz, E. Hüllermeier, и S. Park.
ECML/PKDD (1), том 6911 из Lecture Notes in Computer Science, стр. 312-327. Springer, (2011)

Метаданные

ключ BibTeX: conf/pkdd/ChengFHP11
тип записи: inproceedings
название книги: ECML/PKDD (1)
год: 2011
страницы: 312-327
издательство: Springer
серии: Lecture Notes in Computer Science
том: 6911
Перекрестная ссылка BibTeX: conf/pkdd/2011-1
ee: https://doi.org/10.1007/978-3-642-23780-5_30
isbn: 978-3-642-23779-9
url: http://dblp.uni-trier.de/db/conf/pkdd/pkdd2011-1.html#ChengFHP11

тэги

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

Цитировать эту публикацию

искать в

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter