Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Policy gradient approaches for multi-objective sequential decision making.

S. Parisi, M. Pirotta, N. Smacchia, L. Bascetta, und M. Restelli. IJCNN, Seite 2323-2330. IEEE, (2014)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Alfredo Marcello Marcello

Guglielmo Restelli

Marcello Andrea

Marcello Mariucci

Marcello Bisotti

Weitere Publikationen von Autoren mit dem selben Namen

Bifurcation Analysis of Reinforcement Learning Agents in the Selten's Horse Game.A. Lazaric, E. de Cote, F. Dercole, und M. Restelli. Adaptive Agents and Multi-Agents Systems, Volume 4865 von Lecture Notes in Computer Science, Seite 129-144. Springer, (2007)A Novel Confidence-Based Algorithm for Structured Bandits.A. Tirinzoni, A. Lazaric, und M. Restelli. AISTATS, Volume 108 von Proceedings of Machine Learning Research, Seite 3175-3185. PMLR, (2020)Risk-Averse Trust Region Optimization for Reward-Volatility Reduction.L. Bisi, L. Sabbioni, E. Vittori, M. Papini, und M. Restelli. IJCAI, Seite 4583-4589. ijcai.org, (2020)Special Track on AI in FinTech.ARLO: A framework for Automated Reinforcement Learning.M. Mussi, D. Lombarda, A. Metelli, F. Trovò, und M. Restelli. Expert Syst. Appl., (August 2023)Importance Weighted Transfer of Samples in Reinforcement Learning.A. Tirinzoni, A. Sessa, M. Pirotta, und M. Restelli. ICML, Volume 80 von Proceedings of Machine Learning Research, Seite 4943-4952. PMLR, (2018)Estimating Maximum Expected Value through Gaussian Approximation.C. D'Eramo, M. Restelli, und A. Nuara. ICML, Volume 48 von JMLR Workshop and Conference Proceedings, Seite 1032-1040. JMLR.org, (2016)Tree-based Fitted Q-iteration for Multi-Objective Markov Decision problems.A. Castelletti, F. Pianosi, und M. Restelli. IJCNN, Seite 1-8. IEEE, (2012)Filling the Gap among Coordination, Planning, and Reaction Using a Fuzzy Cognitive Model.A. Bonarini, M. Matteucci, und M. Restelli. RoboCup, Volume 3020 von Lecture Notes in Computer Science, Seite 662-669. Springer, (2003)A Probabilistic Framework for Weighting Different Sensor Data in MUREA.M. Restelli, D. Sorrenti, und F. Marchese. RoboCup, Volume 3020 von Lecture Notes in Computer Science, Seite 678-685. Springer, (2003)A Framework for Robust Sensing in Multi-agent Systems.A. Bonarini, M. Matteucci, und M. Restelli. RoboCup, Volume 2377 von Lecture Notes in Computer Science, Seite 287-292. Springer, (2001)

BibSonomy

Disambiguierung von "Restelli, Marcello"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Policy gradient approaches for multi-objective sequential decision making.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Alfredo Marcello Marcello

Guglielmo Restelli

Marcello Andrea

Marcello Mariucci

Marcello Bisotti

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Restelli, Marcello"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Policy gradient approaches for multi-objective sequential decision making.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Alfredo Marcello Marcello

Guglielmo Restelli

Marcello Andrea

Marcello Mariucci

Marcello Bisotti

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Policy gradient approaches for multi-objective sequential decision making.