Autor der Publikation

Effects of Task Similarity on Policy Transfer with Selective Exploration in Reinforcement Learning.

, und . AAMAS, Seite 2132-2134. International Foundation for Autonomous Agents and Multiagent Systems, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Discovering Low-Dimensional Causal Pathways between Multiple Interacting Neuronal Populations., , , und . CogSci, cognitivesciencesociety.org, (2023)Federated Estimation of Causal Effects from Observational Data., , , und . CoRR, (2021)An Adaptive Kernel Approach to Federated Learning of Heterogeneous Causal Effects., , , und . CoRR, (2023)Bayesian federated estimation of causal effects from observational data., , , und . UAI, Volume 180 von Proceedings of Machine Learning Research, Seite 2024-2034. PMLR, (2022)Hierarchical Reinforcement Learning with Human-AI Collaborative Sub-Goals Optimization., , und . AAMAS, Seite 2310-2312. ACM, (2023)Adaptive Knowledge Transfer based on Transfer Neural Kernel Network., , , , und . AAMAS, Seite 1485-1493. International Foundation for Autonomous Agents and Multiagent Systems, (2020)Toward A Collaborative AI Framework for Assistive Dementia Care.. AAAI Workshops, Volume WS-17 von AAAI Technical Report, AAAI Press, (2017)Pgmc: a Framework for Probabilistic Graphical Model Combination., , und . AMIA, AMIA, (2005)Mixed-Initiative Bayesian Sub-Goal Optimization in Hierarchical Reinforcement Learning., , und . AAMAS, Seite 1328-1336. International Foundation for Autonomous Agents and Multiagent Systems / ACM, (2024)Automating Dynamic Decision Model Construction to Support Clinical Practice Guideline Development., und . EWGLP, Volume 83 von Studies in Health Technology and Informatics, Seite 133-148. IOS Press, (2000)