Autor der Publikation

Piecewise constant reinforcement learning for robotic applications.

, , und . ICINCO-ICSO, Seite 214-221. INSTICC Press, (2007)978-972-8865-82-5.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Policy gradient approaches for multi-objective sequential decision making., , , , und . IJCNN, Seite 2323-2330. IEEE, (2014)Piecewise constant reinforcement learning for robotic applications., , und . ICINCO-ICSO, Seite 214-221. INSTICC Press, (2007)978-972-8865-82-5.Equilibrium approximation in simulation-based extensive-form games., und . AAMAS, Seite 199-206. IFAAMAS, (2011)Bifurcation Analysis of Reinforcement Learning Agents in the Selten's Horse Game., , , und . Adaptive Agents and Multi-Agents Systems, Volume 4865 von Lecture Notes in Computer Science, Seite 129-144. Springer, (2007)Best Arm Identification for Stochastic Rising Bandits., , , , und . CoRR, (2023)Simultaneously Updating All Persistence Values in Reinforcement Learning., , , , und . AAAI, Seite 9668-9676. AAAI Press, (2023)Policy Optimization as Online Learning with Mediator Feedback., , , und . AAAI, Seite 8958-8966. AAAI Press, (2021)Lifelong Hyper-Policy Optimization with Multiple Importance Sampling Regularization., , , und . AAAI, Seite 7525-7533. AAAI Press, (2022)Unsupervised Reinforcement Learning in Multiple Environments., , und . AAAI, Seite 7850-7858. AAAI Press, (2022)An Asymptotically Optimal Primal-Dual Incremental Algorithm for Contextual Linear Bandits., , , und . NeurIPS, (2020)