Autor der Publikation

Counterfactual Credit Assignment in Model-Free Reinforcement Learning.

, , , , , , , , , , , , , und . ICML, Volume 139 von Proceedings of Machine Learning Research, Seite 7654-7664. PMLR, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Multi-objectivization of reinforcement learning problems by reward shaping., , , , , und . IJCNN, Seite 2315-2322. IEEE, (2014)Conditional Importance Sampling for Off-Policy Learning., , , , , , und . AISTATS, Volume 108 von Proceedings of Machine Learning Research, Seite 45-55. PMLR, (2020)Reinforcement Learning from Demonstration through Shaping., , , , , und . IJCAI, Seite 3352-3358. AAAI Press, (2015)Counterfactual Credit Assignment in Model-Free Reinforcement Learning., , , , , , , , , und 3 andere Autor(en). CoRR, (2020)Safe and Efficient Off-Policy Reinforcement Learning., , , und . NIPS, Seite 1046-1054. (2016)Special issue on adaptive and learning agents 2018., , , und . Knowl. Eng. Rev., (2021)Reinforcement Learning in POMDPs with Memoryless Options and Option-Observation Initiation Sets., , , , und . CoRR, (2017)Learning With Options That Terminate Off-Policy., , , , und . AAAI, Seite 3173-3182. AAAI Press, (2018)Hindsight Credit Assignment., , , , , , , , , und 1 andere Autor(en). NeurIPS, Seite 12467-12476. (2019)On the Expressivity of Markov Reward (Extended Abstract)., , , , , , und . IJCAI, Seite 5254-5258. ijcai.org, (2022)