Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning

R. Munos. Foundations and Trends® in Machine Learning, 7 (1): 1--129 (2014)
DOI: 10.1561/2200000038

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Jörg Remien

Rolf Rémi

Peter Remien

Gisela von Remiz

Remi Sakia

Weitere Publikationen von Autoren mit dem selben Namen

World Discovery Models.M. Azar, B. Piot, B. Pires, J. Grill, F. Altché, und R. Munos. CoRR, (2019)Minimax Regret Bounds for Reinforcement Learning.M. Azar, I. Osband, und R. Munos. ICML, Volume 70 von Proceedings of Machine Learning Research, Seite 263-272. PMLR, (2017)Fast LSTD Using Stochastic Approximation: Finite Time Analysis and Application to Traffic Control.P. A., N. Korda, und R. Munos. ECML/PKDD (2), Volume 8725 von Lecture Notes in Computer Science, Seite 66-81. Springer, (2014)Variable Resolution Discretization for High-Accuracy Solutions of Optimal Control Problems.R. Munos, und A. Moore. IJCAI, Seite 1348-1355. Morgan Kaufmann, (1999)Sample Efficient Actor-Critic with Experience Replay.Z. Wang, V. Bapst, N. Heess, V. Mnih, R. Munos, K. Kavukcuoglu, und N. de Freitas. ICLR (Poster), OpenReview.net, (2017)Combining policy gradient and Q-learning.B. O'Donoghue, R. Munos, K. Kavukcuoglu, und V. Mnih. ICLR (Poster), OpenReview.net, (2017)Geometric Variance Reduction in Markov Chains: Application to Value Function and Gradient Estimation.R. Munos. J. Mach. Learn. Res., (2006)Sensitivity Analysis Using Ito-circumflex--Malliavin Calculus and Martingales, and Application to Stochastic Optimal Control.E. Gobet, und R. Munos. SIAM J. Control and Optimization, 43 (5): 1676-1713 (2005)The Uncertainty Bellman Equation and Exploration.B. O'Donoghue, I. Osband, R. Munos, und V. Mnih. CoRR, (2017)PGQ: Combining policy gradient and Q-learning.B. O'Donoghue, R. Munos, K. Kavukcuoglu, und V. Mnih. CoRR, (2016)

BibSonomy

Disambiguierung von "Munos, Remi"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Jörg Remien

Rolf Rémi

Peter Remien

Gisela von Remiz

Remi Sakia

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Munos, Remi"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Jörg Remien

Rolf Rémi

Peter Remien

Gisela von Remiz

Remi Sakia

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning