Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Provably Efficient Exploration in Policy Optimization., , , und . CoRR, (2019)Bridging Exploration and General Function Approximation in Reinforcement Learning: Provably Efficient Kernel and Neural Value Iterations., , , , und . CoRR, (2020)Provably Efficient Safe Exploration via Primal-Dual Policy Optimization., , , , und . CoRR, (2020)Permutation Invariant Policy Optimization for Mean-Field Multi-Agent Reinforcement Learning: A Principled Approach., , , , , , und . CoRR, (2021)Self-Exploring Language Models: Active Preference Elicitation for Online Alignment., , , , , , und . CoRR, (2024)Learning from Demonstration: Provably Efficient Adversarial Policy Imitation with Linear Function Approximation., , , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 14094-14138. PMLR, (2022)Offline Policy Optimization in RL with Variance Regularizaton., , , , , , , , und . CoRR, (2022)Variance Reduced Policy Evaluation with Smooth Function Approximation., , , , und . NeurIPS, Seite 5776-5787. (2019)End-to-End Learning and Intervention in Games., , , und . NeurIPS, (2020)Dynamic Regret of Policy Optimization in Non-Stationary Environments., , , und . NeurIPS, (2020)