From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Tight Regret Bounds for Model-Based Reinforcement Learning with Greedy Policies.

Y. Efroni, N. Merlis, M. Ghavamzadeh, и S. Mannor. NeurIPS, стр. 12203-12213. (2019)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Nadav Ben-Haim

Albert Louis Merlis

Другие публикации лиц с тем же именем

Never Worse, Mostly Better: Stable Policy Improvement in Deep Reinforcement Learning.P. Khanna, G. Tennenholtz, N. Merlis, S. Mannor, и C. Tessler. AAMAS, стр. 2430-2432. ACM, (2023)Tight Lower Bounds for Combinatorial Multi-Armed Bandits.N. Merlis, и S. Mannor. COLT, том 125 из Proceedings of Machine Learning Research, стр. 2830-2857. PMLR, (2020)Multi-armed bandits with guaranteed revenue per arm.D. Baudry, N. Merlis, M. Molina, H. Richard, и V. Perchet. AISTATS, том 238 из Proceedings of Machine Learning Research, стр. 379-387. PMLR, (2024)On Preemption and Learning in Stochastic Scheduling.N. Merlis, H. Richard, F. Sentenac, C. Odic, M. Molina, и V. Perchet. ICML, том 202 из Proceedings of Machine Learning Research, стр. 24478-24516. PMLR, (2023)Reinforcement Learning with Trajectory Feedback.Y. Efroni, N. Merlis, и S. Mannor. AAAI, стр. 7288-7295. AAAI Press, (2021)On Bits and Bandits: Quantifying the Regret-Information Trade-off.I. Shufaro, N. Merlis, N. Weinberger, и S. Mannor. CoRR, (2024)Ranking with Popularity Bias: User Welfare under Self-Amplification Dynamics.G. Tennenholtz, M. Mladenov, N. Merlis, и C. Boutilier. CoRR, (2023)Learn What Not to Learn: Action Elimination with Deep Reinforcement Learning.T. Zahavy, M. Haroush, N. Merlis, D. Mankowitz, и S. Mannor. NeurIPS, стр. 3566-3577. (2018)Ensemble Bootstrapping for Q-Learning.O. Peer, C. Tessler, N. Merlis, и R. Meir. ICML, том 139 из Proceedings of Machine Learning Research, стр. 8454-8463. PMLR, (2021)Reinforcement Learning with History Dependent Dynamic Contexts.G. Tennenholtz, N. Merlis, L. Shani, M. Mladenov, и C. Boutilier. ICML, том 202 из Proceedings of Machine Learning Research, стр. 34011-34053. PMLR, (2023)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter