Artikel in einem Konferenzbericht,

Multi-Task Off-Policy Learning from Bandit Feedback.

J. Hong, B. Kveton, M. Zaheer, S. Katariya, und M. Ghavamzadeh.
ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 13157-13173. PMLR, (2023)

Metadaten

BibTeX-Schlüssel: conf/icml/HongKZKG23
Eintragstyp: inproceedings
Buchtitel: ICML
Jahr: 2023
Seiten: 13157-13173
Verlag: PMLR
Reihe: Proceedings of Machine Learning Research
Band: 202
BibTeX-Querverweis: conf/icml/2023
ee: https://proceedings.mlr.press/v202/hong23a.html
URL: http://dblp.uni-trier.de/db/conf/icml/icml2023.html#HongKZKG23

Tags

dblp

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Bitte melden Sie sich an um selbst Rezensionen oder Kommentare zu erstellen.

Zitieren Sie diese Publikation

Suchen auf