Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Learning the Uncertainty Set in Robust Markov Decision Process.

N. Kumar, K. Wang, U. Gadot, K. Levy, und S. Mannor. Tiny Papers @ ICLR, OpenReview.net, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Navdeep Kaur Panesar

Podiyanachari Santhosh Kumar

Rohini Kumar

Aditya Kumar

Pardeep Kumar

Weitere Publikationen von Autoren mit dem selben Namen

Policy Gradient for Reinforcement Learning with General Utilities.N. Kumar, K. Wang, U. Pratiush, K. Levy, und S. Mannor. Tiny Papers @ ICLR, OpenReview.net, (2024)Policy Gradient for s-Rectangular Robust Markov Decision Processes.N. Kumar, E. Derman, M. Geist, K. Levy, und S. Mannor. CoRR, (2023)An Efficient Solution to s-Rectangular Robust Markov Decision Processes.N. Kumar, K. Levy, K. Wang, und S. Mannor. CoRR, (2023)Deep Learning Approaches for Head and Operculum Segmentation in Zebrafish Microscopy Images.N. Kumar, A. Carletti, P. Gavaia, M. Muller, M. Cancela, P. Geurts, und R. Marée. CAIP (1), Volume 13052 von Lecture Notes in Computer Science, Seite 154-164. Springer, (2021)Policy Gradient with Tree Search (PGTS) in Reinforcement Learning Evades Local Maxima.N. Kumar, P. Agrawal, K. Levy, und S. Mannor. Tiny Papers @ ICLR, OpenReview.net, (2024)On the Global Convergence of Policy Gradient in Average Reward Markov Decision Processes.N. Kumar, Y. Murthy, I. Shufaro, K. Levy, R. Srikant, und S. Mannor. CoRR, (2024)The Geometry of Robust Value Functions.K. Wang, N. Kumar, K. Zhou, B. Hooi, J. Feng, und S. Mannor. ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 22727-22751. PMLR, (2022)Bring Your Own (Non-Robust) Algorithm to Solve Robust MDPs by Estimating The Worst Kernel.U. Gadot, K. Wang, N. Kumar, K. Levy, und S. Mannor. ICML, OpenReview.net, (2024)Solving Non-rectangular Reward-Robust MDPs via Frequency Regularization.U. Gadot, E. Derman, N. Kumar, M. Elfatihi, K. Levy, und S. Mannor. AAAI, Seite 21090-21098. AAAI Press, (2024)The effect of network delays on Distributed Ledgers based on Directed Acyclic Graphs: A mathematical model.N. Kumar, A. Reiffers-Masson, I. Amigo, und S. Rincón. Perform. Evaluation, (2024)

BibSonomy

Disambiguierung von "Kumar, Navdeep"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Learning the Uncertainty Set in Robust Markov Decision Process.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Navdeep Kaur Panesar

Podiyanachari Santhosh Kumar

Rohini Kumar

Aditya Kumar

Pardeep Kumar

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Kumar, Navdeep"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Learning the Uncertainty Set in Robust Markov Decision Process.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Navdeep Kaur Panesar

Podiyanachari Santhosh Kumar

Rohini Kumar

Aditya Kumar

Pardeep Kumar

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Learning the Uncertainty Set in Robust Markov Decision Process.