,

Preference-Based Policy Iteration: Leveraging Preference Learning for Reinforcement Learning.

, , , и .
ECML/PKDD (1), том 6911 из Lecture Notes in Computer Science, стр. 312-327. Springer, (2011)

Метаданные

тэги

Пользователи данного ресурса

  • @ecml_pkdd_2011
  • @dblp

Комментарии и рецензии