Autor der Publikation

Sample-based learning and search with permanent and transient memories.

, , und . ICML, Volume 307 von ACM International Conference Proceeding Series, Seite 968-975. ACM, (2008)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Experiments with reinforcement learning in problems with continuous state and action spaces, , und . Adapt. Behav., 6 (2): 163--217 (1997)Associative Search Network: A Reinforcement Learning Associative Memory, , und . Biological Cybernetics, (1981)Learning to Predict by Methods of Temporal Differences. TR87-509. GTE Laboratories Inc., Waltham, MA, (1987)Generalization in Reinforcement Learning: Successful Examples Using Sparse Coarse Coding. Advances in Neural Information Processing Systems 8, Cambridge, MA: MIT Press, (1996)DYNA, an integrated architecture for learning, planning, and reacting. Working Notes of the 1991 AAAI Spring Symposium on Integrated Intelligent Architectures, (1991)Reinforcement Learning of Local Shape in the Game of Go, , und . IJCAI, Seite 1053-1058. (2007)Multi-step Reinforcement Learning: A Unifying Algorithm., , , und . CoRR, (2017)Learning Feature Relevance Through Step Size Adaptation in Temporal-Difference Learning., , , , und . CoRR, (2019)A new Q(lambda) with interim forward view and Monte Carlo equivalence., , , und . ICML, Volume 32 von JMLR Workshop and Conference Proceedings, Seite 568-576. JMLR.org, (2014)Off-policy learning based on weighted importance sampling with linear computational complexity., und . UAI, Seite 552-561. AUAI Press, (2015)