Autor der Publikation

Approximating two value functions instead of one: towards characterizing a new family of Deep Reinforcement Learning algorithms

, , , und . (2019)cite arxiv:1909.01779.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Approximating two value functions instead of one: towards characterizing a new family of Deep Reinforcement Learning algorithms, , , und . (2019)cite arxiv:1909.01779.Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking., und . ITSC, Seite 951-958. IEEE, (2022)Learning to Evaluate Chess Positions with Deep Neural Networks and Limited Lookahead., , , und . ICPRAM, Seite 276-283. SciTePress, (2018)QVMix and QVMix-Max: Extending the Deep Quality-Value Family of Algorithms to Cooperative Multi-Agent Reinforcement Learning., , , , , und . CoRR, (2020)Deep Quality-Value (DQV) Learning., , , und . BNAIC/BENELEARN, Volume 2491 von CEUR Workshop Proceedings, CEUR-WS.org, (2019)VDSC: Enhancing Exploration Timing with Value Discrepancy and State Counts., , und . CoRR, (2024)Forest Fire Control with Learning from Demonstration and Reinforcement Learning., , , und . IJCNN, Seite 1-8. IEEE, (2020)Advances in Digital Music Iconography: Benchmarking the detection of musical instruments in unrestricted, non-photorealistic images from the artistic domain., , , , , , , und . Digit. Humanit. Q., (2021)Bridging the Reality Gap of Reinforcement Learning based Traffic Signal Control using Domain Randomization and Meta Learning., und . ITSC, Seite 5271-5278. IEEE, (2023)On the Transferability of Winning Tickets in Non-natural Image Datasets., , und . VISIGRAPP (5: VISAPP), Seite 59-69. SCITEPRESS, (2021)