Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Large-scale Validation of Counterfactual Learning Methods: A Test-Bed., , , , und . CoRR, (2016)Metareasoning in Modular Software Systems: On-the-Fly Configuration using Reinforcement Learning with Rich Contextual Representations., , , , , , und . CoRR, (2019)Temporal corpus summarization using submodular word coverage., , , und . CIKM, Seite 754-763. ACM, (2012)Counterfactual Risk Minimization., und . WWW (Companion Volume), Seite 939-941. ACM, (2015)Provably Good Batch Off-Policy Reinforcement Learning Without Great Exploration., , , und . NeurIPS, (2020)Hindsight Learning for MDPs with Exogenous Inputs., , , , , , , , und . ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 31877-31914. PMLR, (2023)Learning Calibratable Policies using Programmatic Style-Consistency., , , , und . ICML, Volume 119 von Proceedings of Machine Learning Research, Seite 11001-11011. PMLR, (2020)REVEAL 2020: Bandit and Reinforcement Learning from User Interactions., , , , , und . RecSys, Seite 628-629. ACM, (2020)Counterfactual Risk Minimization: Learning from Logged Bandit Feedback., und . ICML, Volume 37 von JMLR Workshop and Conference Proceedings, Seite 814-823. JMLR.org, (2015)Deep Learning with Logged Bandit Feedback., , und . ICLR (Poster), OpenReview.net, (2018)