Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Offline Reinforcement Learning from Images with Latent Space Models., , , und . CoRR, (2020)Offline Meta-Reinforcement Learning with Advantage Weighting., , , , und . CoRR, (2020)Diffusion Model Alignment Using Direct Preference Optimization., , , , , , , , , und . CoRR, (2023)MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning., , , , , und . CoRR, (2024)Disentangling Length from Quality in Direct Preference Optimization., , , und . CoRR, (2024)Direct Preference Optimization: Your Language Model is Secretly a Reward Model, , , , , und . (2023)An Emulator for Fine-Tuning Large Language Models using Small Language Models., , , , und . CoRR, (2023)Aligning Modalities in Vision Large Language Models via Preference Fine-tuning., , , , und . CoRR, (2024)Contrastive Preference Learning: Learning from Human Feedback without RL., , , , , , und . CoRR, (2023)MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning., , , , , und . CoRL, Volume 229 von Proceedings of Machine Learning Research, Seite 3654-3671. PMLR, (2023)