Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

AI Alignment: A Comprehensive Survey., , , , , , , , , und 15 andere Autor(en). CoRR, (2023)PKU-SafeRLHF: A Safety Alignment Preference Dataset for Llama Family Models., , , , , , , , und . CoRR, (2024)SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset., , , , , , und . CoRR, (2024)CUP: A Conservative Update Policy Algorithm for Safe Reinforcement Learning., , , , , und . CoRR, (2022)Constrained Update Projection Approach to Safe Policy Optimization., , , , , , , und . NeurIPS, (2022)Language Models Resist Alignment., , , , , , , und . CoRR, (2024)MyoChallenge 2022: Learning contact-rich manipulation using a musculoskeletal hand., , , , , , , , , und 19 andere Autor(en). NeurIPS (Competition and Demos), Volume 220 von Proceedings of Machine Learning Research, Seite 233-250. PMLR, (2021)ProgressGym: Alignment with a Millennium of Moral Progress., , , , , und . CoRR, (2024)Safe RLHF: Safe Reinforcement Learning from Human Feedback., , , , , , , und . ICLR, OpenReview.net, (2024)BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset., , , , , , , , , und . NeurIPS, (2023)