Autor der Publikation

On the Approximation of Cooperative Heterogeneous Multi-Agent Reinforcement Learning (MARL) using Mean Field Control (MFC).

, , , und . J. Mach. Learn. Res., (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Primal-Dual Approach., , , , und . AAAI, Seite 3682-3689. AAAI Press, (2022)An explore-then-commit algorithm for submodular maximization under full-bandit feedback., , , , und . UAI, Volume 180 von Proceedings of Machine Learning Research, Seite 1541-1551. PMLR, (2022)Escaping Saddle Points for Zeroth-order Non-convex Optimization using Estimated Gradient Descent., , und . CISS, Seite 1-6. IEEE, (2020)SARTRES: a semi-autonomous robot teleoperation environment for surgery., , , , , , , , , und 1 andere Autor(en). Comput. methods Biomech. Biomed. Eng. Imaging Vis., 9 (4): 376-383 (2021)Dexterous Skill Transfer between Surgical Procedures for Teleoperated Robotic Surgery., , , , , , , und . RO-MAN, Seite 1236-1242. IEEE, (2021)Transferring Dexterous Surgical Skill Knowledge between Robots for Semi-autonomous Teleoperation., , , , , , , und . RO-MAN, Seite 1-6. IEEE, (2019)Circuit Failure Prediction and Its Application to Transistor Aging., , , und . VTS, Seite 277-286. IEEE Computer Society, (2007)Multi-Agent Multi-Armed Bandits with Limited Communication., , und . J. Mach. Learn. Res., (2022)On the Approximation of Cooperative Heterogeneous Multi-Agent Reinforcement Learning (MARL) using Mean Field Control (MFC)., , , und . J. Mach. Learn. Res., (2022)DART: aDaptive Accept RejecT for non-linear top-K subset identification., , , und . CoRR, (2020)