From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Lifelong Hyper-Policy Optimization with Multiple Importance Sampling Regularization.

P. Liotet, F. Vidaich, A. Metelli, и M. Restelli. AAAI, стр. 7525-7533. AAAI Press, (2022)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Alfredo Marcello Marcello

Guglielmo Restelli

Marcello Andrea

Marcello Mariucci

Marcello Bisotti

Другие публикации лиц с тем же именем

Policy gradient approaches for multi-objective sequential decision making.S. Parisi, M. Pirotta, N. Smacchia, L. Bascetta, и M. Restelli. IJCNN, стр. 2323-2330. IEEE, (2014)Piecewise constant reinforcement learning for robotic applications.A. Bonarini, A. Lazaric, и M. Restelli. ICINCO-ICSO, стр. 214-221. INSTICC Press, (2007)978-972-8865-82-5.Equilibrium approximation in simulation-based extensive-form games.N. Gatti, и M. Restelli. AAMAS, стр. 199-206. IFAAMAS, (2011)Bifurcation Analysis of Reinforcement Learning Agents in the Selten's Horse Game.A. Lazaric, E. de Cote, F. Dercole, и M. Restelli. Adaptive Agents and Multi-Agents Systems, том 4865 из Lecture Notes in Computer Science, стр. 129-144. Springer, (2007)Best Arm Identification for Stochastic Rising Bandits.M. Mussi, A. Montenegro, F. Trovò, M. Restelli, и A. Metelli. CoRR, (2023)Simultaneously Updating All Persistence Values in Reinforcement Learning.L. Sabbioni, L. Daire, L. Bisi, A. Metelli, и M. Restelli. AAAI, стр. 9668-9676. AAAI Press, (2023)Policy Optimization as Online Learning with Mediator Feedback.A. Metelli, M. Papini, P. D'Oro, и M. Restelli. AAAI, стр. 8958-8966. AAAI Press, (2021)Lifelong Hyper-Policy Optimization with Multiple Importance Sampling Regularization.P. Liotet, F. Vidaich, A. Metelli, и M. Restelli. AAAI, стр. 7525-7533. AAAI Press, (2022)Unsupervised Reinforcement Learning in Multiple Environments.M. Mutti, M. Mancassola, и M. Restelli. AAAI, стр. 7850-7858. AAAI Press, (2022)An Asymptotically Optimal Primal-Dual Incremental Algorithm for Contextual Linear Bandits.A. Tirinzoni, M. Pirotta, M. Restelli, и A. Lazaric. NeurIPS, (2020)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter