Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Iterate averaging as regularization for stochastic gradient descent, und . (2018)cite arxiv:1802.08009.Prediction by random-walk perturbation., , und . COLT, Volume 30 von JMLR Workshop and Conference Proceedings, Seite 460-473. JMLR.org, (2013)First-order regret bounds for combinatorial semi-bandits.. COLT, Volume 40 von JMLR Workshop and Conference Proceedings, Seite 1360-1375. JMLR.org, (2015)Online Influence Maximization with Local Observations., , und . ALT, Volume 98 von Proceedings of Machine Learning Research, Seite 557-580. PMLR, (2019)Apprenticeship Learning using Inverse Reinforcement Learning and Gradient Methods, und . CoRR, (2012)Online Learning with Off-Policy Feedback., , und . ALT, Volume 201 von Proceedings of Machine Learning Research, Seite 620-641. PMLR, (2023)Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits., , , und . NeurIPS, (2022)Explore no more: Improved high-probability regret bounds for non-stochastic bandits.. NIPS, Seite 3168-3176. (2015)Online Markov Decision Processes under Bandit Feedback., , , und . NIPS, Seite 1804-1812. Curran Associates, Inc., (2010)A Unifying View of Optimism in Episodic Reinforcement Learning., und . NeurIPS, (2020)