,

Reinforcement Learning with High-Dimensional Continuous Actions

, и .
WL-TR-93-1147. Wright Laboratory, Wright-Patterson Air Force Base, (1993)

Метаданные

тэги

Пользователи данного ресурса

  • @schaul
  • @idsia

Комментарии и рецензии