,

Off-Policy Temporal Difference Learning with Function Approximation.

, , и .
ICML, стр. 417-424. Morgan Kaufmann, (2001)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии