Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Sublinear Optimal Policy Value Estimation in Contextual Bandits., , und . CoRR, (2019)Being Optimistic to Be Conservative: Quickly Learning a CVaR Policy., , , und . AAAI, Seite 4436-4443. AAAI Press, (2020)Provable Benefits of Actor-Critic Methods for Offline Reinforcement Learning., , und . NeurIPS, Seite 13626-13640. (2021)Off-policy Policy Evaluation For Sequential Decisions Under Unobserved Confounding., , , und . NeurIPS, (2020)Reinforcement Learning with State Observation Costs in Action-Contingent Noiselessly Observable Markov Decision Processes., , und . NeurIPS, Seite 15650-15666. (2021)Fairer but Not Fair Enough On the Equitability of Knowledge Tracing., und . LAK, Seite 335-339. ACM, (2019)Adaptive Instrument Design for Indirect Experiments., , , und . ICLR, OpenReview.net, (2024)Examining the Use of an AI-Powered Teacher Orchestration Tool at Scale., , , und . L@S, Seite 356-360. ACM, (2024)Off-Policy Evaluation for Action-Dependent Non-Stationary Environments., , , , , und . CoRR, (2023)Tighter Problem-Dependent Regret Bounds in Reinforcement Learning without Domain Knowledge using Value Function Bounds., und . ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 7304-7312. PMLR, (2019)