Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Counterfactual Multi-Agent Policy Gradients., , , , und . AAAI, Seite 2974-2982. AAAI Press, (2018)Transient Non-stationarity and Generalisation in Deep Reinforcement Learning., , , , und . ICLR, OpenReview.net, (2021)Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement Learning., , und . NeurIPS, Seite 8149-8160. (2019)Multi-Agent Common Knowledge Reinforcement Learning., , , , , und . NeurIPS, Seite 9924-9935. (2019)Weighted QMIX: Expanding Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning., , , und . NeurIPS, (2020)An Investigation of the Bias-Variance Tradeoff in Meta-Gradients., , , , und . CoRR, (2022)DiCE: The Infinitely Differentiable Monte-Carlo Estimator., , , , , und . ICLR (Workshop), OpenReview.net, (2018)Self-Consistent Models and Values., , , , , , und . NeurIPS, Seite 1111-1125. (2021)Model-Value Inconsistency as a Signal for Epistemic Uncertainty., , , , , , , , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 6474-6498. PMLR, (2022)Discovering General Reinforcement Learning Algorithms with Adversarial Environment Design., , , , , , , und . CoRR, (2023)