Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

DiCE: The Infinitely Differentiable Monte-Carlo Estimator.

J. Foerster, G. Farquhar, M. Al-Shedivat, T. Rocktäschel, E. Xing, und S. Whiteson. ICLR (Workshop), OpenReview.net, (2018)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Robert Gregory

Gregory Kroon

Isa Gregory

Xaver Gregory

Gregory Okereke

Weitere Publikationen von Autoren mit dem selben Namen

Counterfactual Multi-Agent Policy Gradients.J. Foerster, G. Farquhar, T. Afouras, N. Nardelli, und S. Whiteson. AAAI, Seite 2974-2982. AAAI Press, (2018)Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement Learning.G. Farquhar, S. Whiteson, und J. Foerster. NeurIPS, Seite 8149-8160. (2019)Multi-Agent Common Knowledge Reinforcement Learning.C. de Witt, J. Foerster, G. Farquhar, P. Torr, W. Boehmer, und S. Whiteson. NeurIPS, Seite 9924-9935. (2019)Weighted QMIX: Expanding Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning.T. Rashid, G. Farquhar, B. Peng, und S. Whiteson. NeurIPS, (2020)Transient Non-stationarity and Generalisation in Deep Reinforcement Learning.M. Igl, G. Farquhar, J. Luketina, W. Boehmer, und S. Whiteson. ICLR, OpenReview.net, (2021)DiCE: The Infinitely Differentiable Monte-Carlo Estimator.J. Foerster, G. Farquhar, M. Al-Shedivat, T. Rocktäschel, E. Xing, und S. Whiteson. ICLR (Workshop), OpenReview.net, (2018)Self-Consistent Models and Values.G. Farquhar, K. Baumli, Z. Marinho, A. Filos, M. Hessel, H. van Hasselt, und D. Silver. NeurIPS, Seite 1111-1125. (2021)An Investigation of the Bias-Variance Tradeoff in Meta-Gradients.R. Vuorio, J. Beck, S. Whiteson, J. Foerster, und G. Farquhar. CoRR, (2022)Model-Value Inconsistency as a Signal for Epistemic Uncertainty.A. Filos, E. Vértes, Z. Marinho, G. Farquhar, D. Borsa, A. Friesen, F. Behbahani, T. Schaul, A. Barreto, und S. Osindero. ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 6474-6498. PMLR, (2022)Multi-Agent Common Knowledge Reinforcement Learning.J. Foerster, C. de Witt, G. Farquhar, P. Torr, W. Boehmer, und S. Whiteson. CoRR, (2018)

BibSonomy

Disambiguierung von "Farquhar, Gregory"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

DiCE: The Infinitely Differentiable Monte-Carlo Estimator.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Robert Gregory

Gregory Kroon

Isa Gregory

Xaver Gregory

Gregory Okereke

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Farquhar, Gregory"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML DiCE: The Infinitely Differentiable Monte-Carlo Estimator.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Robert Gregory

Gregory Kroon

Isa Gregory

Xaver Gregory

Gregory Okereke

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

DiCE: The Infinitely Differentiable Monte-Carlo Estimator.