Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Policy Gradient for Reinforcement Learning with General Utilities., , , , und . Tiny Papers @ ICLR, OpenReview.net, (2024)Policy Gradient for s-Rectangular Robust Markov Decision Processes., , , , und . CoRR, (2023)An Efficient Solution to s-Rectangular Robust Markov Decision Processes., , , und . CoRR, (2023)Deep Learning Approaches for Head and Operculum Segmentation in Zebrafish Microscopy Images., , , , , , und . CAIP (1), Volume 13052 von Lecture Notes in Computer Science, Seite 154-164. Springer, (2021)Policy Gradient with Tree Search (PGTS) in Reinforcement Learning Evades Local Maxima., , , und . Tiny Papers @ ICLR, OpenReview.net, (2024)On the Global Convergence of Policy Gradient in Average Reward Markov Decision Processes., , , , , und . CoRR, (2024)The Geometry of Robust Value Functions., , , , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 22727-22751. PMLR, (2022)Bring Your Own (Non-Robust) Algorithm to Solve Robust MDPs by Estimating The Worst Kernel., , , , und . ICML, OpenReview.net, (2024)Solving Non-rectangular Reward-Robust MDPs via Frequency Regularization., , , , , und . AAAI, Seite 21090-21098. AAAI Press, (2024)The effect of network delays on Distributed Ledgers based on Directed Acyclic Graphs: A mathematical model., , , und . Perform. Evaluation, (2024)