,

Reinforcement Learning with High-Dimensional Continuous Actions

L. Baird, и H. Klopf.
WL-TR-93-1147. Wright Laboratory, Wright-Patterson Air Force Base, (1993)

Метаданные

ключ BibTeX: baird:tech
тип записи: techreport
год: 1993
учреждение: Wright Laboratory, Wright-Patterson Air Force Base
номер: WL-TR-93-1147
priority: 2
citeulike-article-id: 2380171

тэги

inaki

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

Цитировать эту публикацию

искать в

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter