,

OPIRL: Sample Efficient Off-Policy Inverse Reinforcement Learning via Distribution Matching.

, , , и .
ICRA, стр. 448-454. IEEE, (2022)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии