Artikel in einem Konferenzbericht,

Online Policy Gradient for Model Free Learning of Linear Quadratic Regulators with √T Regret.

, und .
ICML, Volume 139 von Proceedings of Machine Learning Research, Seite 1304-1313. PMLR, (2021)

Metadaten

Tags

Nutzer

  • @dblp

Kommentare und Rezensionen