Artikel in einem Konferenzbericht,

Sample-Efficient Reinforcement Learning Based on Dynamics Models via Meta-policy Optimization.

G. Zuo, Z. Tian, S. Huang, und D. Gong.
ICCSIP, Volume 1515 von Communications in Computer and Information Science, Seite 360-373. Springer, (2021)

Metadaten

BibTeX-Schlüssel: conf/iccsip/ZuoTHG21
Eintragstyp: inproceedings
Buchtitel: ICCSIP
Jahr: 2021
Seiten: 360-373
Verlag: Springer
Reihe: Communications in Computer and Information Science
Band: 1515
BibTeX-Querverweis: conf/iccsip/2021
ee: https://doi.org/10.1007/978-981-16-9247-5_28
isbn: 978-981-16-9247-5
URL: http://dblp.uni-trier.de/db/conf/iccsip/iccsip2021.html#ZuoTHG21

Tags

dblp

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Bitte melden Sie sich an um selbst Rezensionen oder Kommentare zu erstellen.

Zitieren Sie diese Publikation

Suchen auf