Autor der Publikation

Learning Exploration/Exploitation Strategies for Single Trajectory Reinforcement Learning.

, , , und . EWRL, Volume 24 von JMLR Proceedings, Seite 1-10. JMLR.org, (2012)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

On Overfitting and Asymptotic Bias in Batch Reinforcement Learning with Partial Observability (Extended Abstract)., , , , und . IJCAI, Seite 5055-5059. ijcai.org, (2020)Journal track.Assessing the Economic Value of Renewable Resource Complementarity for Power Systems: an ENTSO-E Study., , , , , , , und . CoRR, (2020)Imitative Learning for Online Planning in Microgrids., , , , und . DARE, Volume 9518 von Lecture Notes in Computer Science, Seite 1-15. Springer, (2015)On overfitting and asymptotic bias in batch reinforcement learning with partial observability., , und . CoRR, (2017)A Gaussian mixture approach to model stochastic processes in power systems., , , , und . PSCC, Seite 1-7. IEEE, (2016)Active exploration by searching for experiments that falsify the computed control policy., , , und . ADPRL, Seite 40-47. IEEE, (2011)An App-based Algorithmic Approach for Harvesting Local and Renewable Energy using Electric Vehicles., , , , und . ICAART (1), Seite 322-327. SciTePress, (2017)Decision Making from Confidence Measurement on the Reward Growth using Supervised Learning - A Study Intended for Large-scale Video Games., , , , und . ICAART (2), Seite 264-271. SciTePress, (2016)978-989-758-172-4.Imitative learning for real-time strategy games., , , und . CIG, Seite 424-429. IEEE, (2012)Inferring bounds on the performance of a control policy from a sample of trajectories., , , und . ADPRL, Seite 117-123. IEEE, (2009)