Artikel in einem Konferenzbericht,

Sample-Efficient Reinforcement Learning Based on Dynamics Models via Meta-policy Optimization.

, , , und .
ICCSIP, Volume 1515 von Communications in Computer and Information Science, Seite 360-373. Springer, (2021)

Metadaten

Tags

Nutzer

  • @dblp

Kommentare und Rezensionen