Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Fine-Tuning Language Models from Human Preferences., , , , , , , und . CoRR, (2019)Electrical Flows, Laplacian Systems, and Faster Approximation of Maximum Flow in Undirected Graphs, , , , und . Proceedings of the Forty-third Annual ACM Symposium on Theory of Computing, Seite 273--282. New York, NY, USA, ACM, (2011)Learning to summarize from human feedback., , , , , , , , und . CoRR, (2020)Theano: A Python framework for fast computation of mathematical expressions, , , , , , , , , und 103 andere Autor(en). (2016)cite arxiv:1605.02688Comment: 19 pages, 5 figures.Model evaluation for extreme risks., , , , , , , , , und 11 andere Autor(en). CoRR, (2023)Manipulation-resistant online learning.. University of California, Berkeley, USA, (2017)base-search.net (ftcdlib:qt0w22c86t).Lossless Fault-Tolerant Data Structures with Additive Overhead., , und . WADS, Volume 6844 von Lecture Notes in Computer Science, Seite 243-254. Springer, (2011)Reflective Oracles: A Foundation for Game Theory in Artificial Intelligence., , und . LORI, Volume 9394 von Lecture Notes in Computer Science, Seite 411-415. Springer, (2015)Provably manipulation-resistant reputation systems.. COLT, Volume 49 von JMLR Workshop and Conference Proceedings, Seite 670-697. JMLR.org, (2016)Deep Reinforcement Learning from Human Preferences., , , , , und . NIPS, Seite 4299-4307. (2017)