Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Stimulus Representation and the Timing of Reward-Prediction Errors in Models of the Dopamine System., , und . Neural Comput., 20 (12): 3034-3054 (2008)Off-policy learning based on weighted importance sampling with linear computational complexity., und . UAI, Seite 552-561. AUAI Press, (2015)A First Empirical Study of Emphatic Temporal Difference Learning., , und . CoRR, (2017)Multi-step Reinforcement Learning: A Unifying Algorithm., , , und . CoRR, (2017)Learning Feature Relevance Through Step Size Adaptation in Temporal-Difference Learning., , , , und . CoRR, (2019)A new Q(lambda) with interim forward view and Monte Carlo equivalence., , , und . ICML, Volume 32 von JMLR Workshop and Conference Proceedings, Seite 568-576. JMLR.org, (2014)Reinforcement Learning of Local Shape in the Game of Go, , und . IJCAI, Seite 1053-1058. (2007)Associative Search Network: A Reinforcement Learning Associative Memory, , und . Biological Cybernetics, (1981)Experiments with reinforcement learning in problems with continuous state and action spaces, , und . Adapt. Behav., 6 (2): 163--217 (1997)Learning to Predict by Methods of Temporal Differences. TR87-509. GTE Laboratories Inc., Waltham, MA, (1987)