Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Counterfactual Credit Assignment in Model-Free Reinforcement Learning.

T. Mesnard, T. Weber, F. Viola, S. Thakoor, A. Saade, A. Harutyunyan, W. Dabney, T. Stepleton, N. Heess, A. Guez, E. Moulines, M. Hutter, L. Buesing, und R. Munos. ICML, Volume 139 von Proceedings of Machine Learning Research, Seite 7654-7664. PMLR, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Lilit Harutyunyan

Davit Harutyunyan

Gurgen Harutyunyan

Davit Harutyunyan

Weitere Publikationen von Autoren mit dem selben Namen

Multi-objectivization of reinforcement learning problems by reward shaping.T. Brys, A. Harutyunyan, P. Vrancx, M. Taylor, D. Kudenko, und A. Nowé. IJCNN, Seite 2315-2322. IEEE, (2014)Conditional Importance Sampling for Off-Policy Learning.M. Rowland, A. Harutyunyan, H. van Hasselt, D. Borsa, T. Schaul, R. Munos, und W. Dabney. AISTATS, Volume 108 von Proceedings of Machine Learning Research, Seite 45-55. PMLR, (2020)Reinforcement Learning from Demonstration through Shaping.T. Brys, A. Harutyunyan, H. Suay, S. Chernova, M. Taylor, und A. Nowé. IJCAI, Seite 3352-3358. AAAI Press, (2015)Counterfactual Credit Assignment in Model-Free Reinforcement Learning.T. Mesnard, T. Weber, F. Viola, S. Thakoor, A. Saade, A. Harutyunyan, W. Dabney, T. Stepleton, N. Heess, A. Guez und 3 andere Autor(en). CoRR, (2020)Safe and Efficient Off-Policy Reinforcement Learning.R. Munos, T. Stepleton, A. Harutyunyan, und M. Bellemare. NIPS, Seite 1046-1054. (2016)Special issue on adaptive and learning agents 2018.P. Mannion, A. Harutyunyan, B. Peng, und K. Subramanian. Knowl. Eng. Rev., (2021)Reinforcement Learning in POMDPs with Memoryless Options and Option-Observation Initiation Sets.D. Steckelmacher, D. Roijers, A. Harutyunyan, P. Vrancx, und A. Nowé. CoRR, (2017)Learning With Options That Terminate Off-Policy.A. Harutyunyan, P. Vrancx, P. Bacon, D. Precup, und A. Nowé. AAAI, Seite 3173-3182. AAAI Press, (2018)Hindsight Credit Assignment.A. Harutyunyan, W. Dabney, T. Mesnard, M. Azar, B. Piot, N. Heess, H. van Hasselt, G. Wayne, S. Singh, D. Precup und 1 andere Autor(en). NeurIPS, Seite 12467-12476. (2019)On the Expressivity of Markov Reward (Extended Abstract).D. Abel, W. Dabney, A. Harutyunyan, M. Ho, M. Littman, D. Precup, und S. Singh. IJCAI, Seite 5254-5258. ijcai.org, (2022)

BibSonomy

Disambiguierung von "Harutyunyan, Anna"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Counterfactual Credit Assignment in Model-Free Reinforcement Learning.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Lilit Harutyunyan

Davit Harutyunyan

Davit Harutyunyan

Gurgen Harutyunyan

Davit Harutyunyan

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Harutyunyan, Anna"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Counterfactual Credit Assignment in Model-Free Reinforcement Learning.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Lilit Harutyunyan

Davit Harutyunyan

Davit Harutyunyan

Gurgen Harutyunyan

Davit Harutyunyan

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Counterfactual Credit Assignment in Model-Free Reinforcement Learning.