Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Optimistic Policy Optimization via Multiple Importance Sampling.

M. Papini, A. Metelli, L. Lupo, und M. Restelli. ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 4989-4999. PMLR, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Matteo Garavoglia

Marco Matteo

Matteo Bertini

Matteo Rini

Matteo Gabba

Weitere Publikationen von Autoren mit dem selben Namen

Feature Selection via Mutual Information: New Theoretical Insights.M. Beraha, A. Metelli, M. Papini, A. Tirinzoni, und M. Restelli. IJCNN, Seite 1-9. IEEE, (2019)Offline Primal-Dual Reinforcement Learning for Linear MDPs.G. Gabbianelli, G. Neu, M. Papini, und N. Okolo. AISTATS, Volume 238 von Proceedings of Machine Learning Research, Seite 3169-3177. PMLR, (2024)Safe policy optimization.M. Papini. Polytechnic University of Milan, Italy, (2021)Automated Reasoning for Reinforcement Learning Agents in Structured Environments.A. Gianola, M. Montali, und M. Papini. OVERLAY@GandALF, Volume 2987 von CEUR Workshop Proceedings, Seite 43-48. CEUR-WS.org, (2021)Gradient-Aware Model-Based Policy Search.P. D'Oro, A. Metelli, A. Tirinzoni, M. Papini, und M. Restelli. AAAI, Seite 3801-3808. AAAI Press, (2020)Risk-Averse Trust Region Optimization for Reward-Volatility Reduction.L. Bisi, L. Sabbioni, E. Vittori, M. Papini, und M. Restelli. CoRR, (2019)Balancing Learning Speed and Stability in Policy Gradient via Adaptive Exploration.M. Papini, A. Battistello, und M. Restelli. AISTATS, Volume 108 von Proceedings of Machine Learning Research, Seite 1188-1199. PMLR, (2020)Smoothing Policies and Safe Policy Gradients.M. Papini, M. Pirotta, und M. Restelli. CoRR, (2019)Optimistic Policy Optimization via Multiple Importance Sampling.M. Papini, A. Metelli, L. Lupo, und M. Restelli. ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 4989-4999. PMLR, (2019)Offline Primal-Dual Reinforcement Learning for Linear MDPs.G. Gabbianelli, G. Neu, N. Okolo, und M. Papini. CoRR, (2023)

BibSonomy

Disambiguierung von "Papini, Matteo"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Optimistic Policy Optimization via Multiple Importance Sampling.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Matteo Garavoglia

Marco Matteo

Matteo Bertini

Matteo Rini

Matteo Gabba

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Papini, Matteo"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Optimistic Policy Optimization via Multiple Importance Sampling.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Matteo Garavoglia

Marco Matteo

Matteo Bertini

Matteo Rini

Matteo Gabba

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Optimistic Policy Optimization via Multiple Importance Sampling.