Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Internal Rewards Mitigate Agent Boundedness., , und . ICML, Seite 1007-1014. Omnipress, (2010)Accounting for Agreement Phenomena in Sentence Comprehension with Transformer Language Models: Effects of Similarity-based Interference on Surprisal and Attention., und . CMLS, Seite 61-71. Association for Computational Linguistics, (2021)Strong mitigation: nesting search for good policies within search for good reward., , , und . AAMAS, Seite 407-414. IFAAMAS, (2012)Deep Learning for Reward Design to Improve Monte Carlo Tree Search in ATARI Games., , , und . IJCAI, Seite 1519-1525. IJCAI/AAAI Press, (2016)Reinforcement Learning for Sparse-Reward Object-Interaction Tasks in a First-person Simulated 3D Environment., , , , , , und . IJCAI, Seite 2219-2226. ijcai.org, (2021)In-Context Analogical Reasoning with Pre-Trained Language Models., , , und . ACL (1), Seite 1953-1969. Association for Computational Linguistics, (2023)Reinforcement Learning of Implicit and Explicit Control Flow in Instructions., , , und . CoRR, (2021)Reward Design via Online Gradient Ascent., , und . NIPS, Seite 2190-2198. Curran Associates, Inc., (2010)Optimal rewards in multiagent teams., , , und . ICDL-EPIROB, Seite 1-8. IEEE, (2012)Combining Multiple Knowledge Sources in an Integrated Intelligent System., , , und . IEEE Expert, 8 (3): 35-44 (1993)