Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Bifurcation Analysis of Reinforcement Learning Agents in the Selten's Horse Game., , , und . Adaptive Agents and Multi-Agents Systems, Volume 4865 von Lecture Notes in Computer Science, Seite 129-144. Springer, (2007)A Novel Confidence-Based Algorithm for Structured Bandits., , und . AISTATS, Volume 108 von Proceedings of Machine Learning Research, Seite 3175-3185. PMLR, (2020)Risk-Averse Trust Region Optimization for Reward-Volatility Reduction., , , , und . IJCAI, Seite 4583-4589. ijcai.org, (2020)Special Track on AI in FinTech.ARLO: A framework for Automated Reinforcement Learning., , , , und . Expert Syst. Appl., (August 2023)Importance Weighted Transfer of Samples in Reinforcement Learning., , , und . ICML, Volume 80 von Proceedings of Machine Learning Research, Seite 4943-4952. PMLR, (2018)Estimating Maximum Expected Value through Gaussian Approximation., , und . ICML, Volume 48 von JMLR Workshop and Conference Proceedings, Seite 1032-1040. JMLR.org, (2016)Tree-based Fitted Q-iteration for Multi-Objective Markov Decision problems., , und . IJCNN, Seite 1-8. IEEE, (2012)Filling the Gap among Coordination, Planning, and Reaction Using a Fuzzy Cognitive Model., , und . RoboCup, Volume 3020 von Lecture Notes in Computer Science, Seite 662-669. Springer, (2003)A Probabilistic Framework for Weighting Different Sensor Data in MUREA., , und . RoboCup, Volume 3020 von Lecture Notes in Computer Science, Seite 678-685. Springer, (2003)A Framework for Robust Sensing in Multi-agent Systems., , und . RoboCup, Volume 2377 von Lecture Notes in Computer Science, Seite 287-292. Springer, (2001)