From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Leveraging Good Representations in Linear Contextual Bandits.

M. Papini, A. Tirinzoni, M. Restelli, A. Lazaric, и M. Pirotta. ICML, том 139 из Proceedings of Machine Learning Research, стр. 8371-8380. PMLR, (2021)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Alessandro Valeri

Fluorescence resonance energy transfer between multiple chromophores studied by single-molecule spectroscopyA. Valeri. Uni Düsseldorf, (2009)

Alessandro Zivelonghi

Alessandro Nova

Alessandro Topa

Alessandro Mirizzi

Другие публикации лиц с тем же именем

Reinforcement learning in extensive form games with incomplete information: the bargaining case study.A. Lazaric, E. de Cote, и N. Gatti. AAMAS, стр. 46. IFAAMAS, (2007)Improving Batch Reinforcement Learning Performance through Transfer of Samples.A. Lazaric, M. Restelli, и A. Bonarini. STAIRS, том 179 из Frontiers in Artificial Intelligence and Applications, стр. 106-117. IOS Press, (2008)Transfer of samples in batch reinforcement learning.A. Lazaric, M. Restelli, и A. Bonarini. ICML, том 307 из ACM International Conference Proceeding Series, стр. 544-551. ACM, (2008)Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning.R. Fruit, M. Pirotta, A. Lazaric, и R. Ortner. ICML, том 80 из Proceedings of Machine Learning Research, стр. 1573-1581. PMLR, (2018)Incremental Skill Acquisition for Self-motivated Learning Animats.A. Bonarini, A. Lazaric, и M. Restelli. SAB, том 4095 из Lecture Notes in Computer Science, стр. 357-368. Springer, (2006)Exploration-Exploitation in MDPs with Options.R. Fruit, и A. Lazaric. AISTATS, том 54 из Proceedings of Machine Learning Research, стр. 576-584. PMLR, (2017)Maximum Entropy Semi-Supervised Inverse Reinforcement Learning.J. Audiffren, M. Valko, A. Lazaric, и M. Ghavamzadeh. IJCAI, стр. 3315-3321. AAAI Press, (2015)No-Regret Exploration in Goal-Oriented Reinforcement Learning.J. Tarbouriech, E. Garcelon, M. Valko, M. Pirotta, и A. Lazaric. CoRR, (2019)Multi-Bandit Best Arm Identification.V. Gabillon, M. Ghavamzadeh, A. Lazaric, и S. Bubeck. NIPS, стр. 2222-2230. (2011)Reinforcement Learning in Continuous Action Spaces through Sequential Monte Carlo Methods.A. Lazaric, M. Restelli, и A. Bonarini. NIPS, стр. 833-840. Curran Associates, Inc., (2007)

BibSonomy

Disambiguation

Please choose a person to relate this publication to

Alessandro Valeri

Alessandro Zivelonghi

Alessandro Nova

Alessandro Topa

Alessandro Mirizzi

Другие публикации лиц с тем же именем

Disambiguation

BibSonomy

Disambiguation

копироватьудалитьдобавить публикацию в буферЗапись сообществапосмотреть историю данной записиURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Leveraging Good Representations in Linear Contextual Bandits.

Please choose a person to relate this publication to

Alessandro Valeri

Alessandro Zivelonghi

Alessandro Nova

Alessandro Topa

Alessandro Mirizzi

Другие публикации лиц с тем же именем

Disambiguation