Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Sample-based learning and search with permanent and transient memories.

D. Silver, R. Sutton, und M. Müller. ICML, Volume 307 von ACM International Conference Proceeding Series, Seite 968-975. ACM, (2008)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Richard S Ascough

William Banks Sutton

S Danischewski

S Ulrich

S Hilt

Weitere Publikationen von Autoren mit dem selben Namen

Experiments with reinforcement learning in problems with continuous state and action spacesJ. Santamar&\#237;a, R. Sutton, und A. Ram. Adapt. Behav., 6 (2): 163--217 (1997)Associative Search Network: A Reinforcement Learning Associative MemoryA. Barto, R. Sutton, und P. Brouwer. Biological Cybernetics, (1981)Learning to Predict by Methods of Temporal DifferencesR. Sutton. TR87-509. GTE Laboratories Inc., Waltham, MA, (1987)Generalization in Reinforcement Learning: Successful Examples Using Sparse Coarse CodingR. Sutton. Advances in Neural Information Processing Systems 8, Cambridge, MA: MIT Press, (1996)DYNA, an integrated architecture for learning, planning, and reactingR. Sutton. Working Notes of the 1991 AAAI Spring Symposium on Integrated Intelligent Architectures, (1991)Reinforcement Learning of Local Shape in the Game of GoD. Silver, R. Sutton, und M. 0003. IJCAI, Seite 1053-1058. (2007)Multi-step Reinforcement Learning: A Unifying Algorithm.K. Asis, J. Hernandez-Garcia, G. Holland, und R. Sutton. CoRR, (2017)Learning Feature Relevance Through Step Size Adaptation in Temporal-Difference Learning.A. Kearney, V. Veeriah, J. Travnik, P. Pilarski, und R. Sutton. CoRR, (2019)A new Q(lambda) with interim forward view and Monte Carlo equivalence.R. Sutton, A. Mahmood, D. Precup, und H. van Hasselt. ICML, Volume 32 von JMLR Workshop and Conference Proceedings, Seite 568-576. JMLR.org, (2014)Off-policy learning based on weighted importance sampling with linear computational complexity.A. Mahmood, und R. Sutton. UAI, Seite 552-561. AUAI Press, (2015)

BibSonomy

Disambiguierung von "Sutton, Richard S."

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Sample-based learning and search with permanent and transient memories.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Richard S Ascough

William Banks Sutton

S Danischewski

S Ulrich

S Hilt

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Sutton, Richard S."

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Sample-based learning and search with permanent and transient memories.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Richard S Ascough

William Banks Sutton

S Danischewski

S Ulrich

S Hilt

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Sample-based learning and search with permanent and transient memories.