Autor der Publikation

Exploration by Maximizing Renyi Entropy for Reward-Free RL Framework.

, , , und . AAAI, Seite 10859-10867. AAAI Press, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Utility optimal scheduling in energy harvesting networks., und . MobiHoc, Seite 21. ACM, (2011)Optimizing power consumption of mobile games., , , und . HotPower@SOSP, Seite 21-25. ACM, (2015)One is More: Diverse Perspectives within a Single Network for Efficient DRL., , und . CoRR, (2023)LIFO-Backpressure achieves near optimal utility-delay tradeoff., , , und . WiOpt, Seite 70-77. IEEE, (2011)The Value-of-Information in Matching with Queues.. MobiHoc, Seite 57-66. ACM, (2015)Prices and subsidies in the sharing economy., , und . Perform. Evaluation, (2019)RTCP - Reduce Delay Variability with an End-to-end Approach., , und . Networking, Seite 235-243. IEEE, (2020)Dueling Bandits: From Two-dueling to Multi-dueling., , und . AAMAS, Seite 348-356. International Foundation for Autonomous Agents and Multiagent Systems, (2020)Adaptive Best-of-Both-Worlds Algorithm for Heavy-Tailed Multi-Armed Bandits., , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 9173-9200. PMLR, (2022)A One-Size-Fits-All Solution to Conservative Bandit Problems., , und . AAAI, Seite 7254-7261. AAAI Press, (2021)