Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Recursively Summarizing Books with Human Feedback

J. Wu, L. Ouyang, D. Ziegler, N. Stiennon, R. Lowe, J. Leike, und P. Christiano. (2021)cite arxiv:2109.10862.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Christiano German

Christiano Pesavento

Christiano German

Weitere Publikationen von Autoren mit dem selben Namen

Fine-Tuning Language Models from Human Preferences.D. Ziegler, N. Stiennon, J. Wu, T. Brown, A. Radford, D. Amodei, P. Christiano, und G. Irving. CoRR, (2019)Electrical Flows, Laplacian Systems, and Faster Approximation of Maximum Flow in Undirected GraphsP. Christiano, J. Kelner, A. Madry, D. Spielman, und S. Teng. Proceedings of the Forty-third Annual ACM Symposium on Theory of Computing, Seite 273--282. New York, NY, USA, ACM, (2011)Learning to summarize from human feedback.N. Stiennon, L. Ouyang, J. Wu, D. Ziegler, R. Lowe, C. Voss, A. Radford, D. Amodei, und P. Christiano. CoRR, (2020)Theano: A Python framework for fast computation of mathematical expressionsT. Team, R. Al-Rfou, G. Alain, A. Almahairi, C. Angermueller, D. Bahdanau, N. Ballas, F. Bastien, J. Bayer, A. Belikov und 103 andere Autor(en). (2016)cite arxiv:1605.02688Comment: 19 pages, 5 figures.Model evaluation for extreme risks.T. Shevlane, S. Farquhar, B. Garfinkel, M. Phuong, J. Whittlestone, J. Leung, D. Kokotajlo, N. Marchal, M. Anderljung, N. Kolt und 11 andere Autor(en). CoRR, (2023)Manipulation-resistant online learning.P. Christiano. University of California, Berkeley, USA, (2017)base-search.net (ftcdlib:qt0w22c86t).Lossless Fault-Tolerant Data Structures with Additive Overhead.P. Christiano, E. Demaine, und S. Kishore. WADS, Volume 6844 von Lecture Notes in Computer Science, Seite 243-254. Springer, (2011)Reflective Oracles: A Foundation for Game Theory in Artificial Intelligence.B. Fallenstein, J. Taylor, und P. Christiano. LORI, Volume 9394 von Lecture Notes in Computer Science, Seite 411-415. Springer, (2015)Provably manipulation-resistant reputation systems.P. Christiano. COLT, Volume 49 von JMLR Workshop and Conference Proceedings, Seite 670-697. JMLR.org, (2016)Deep Reinforcement Learning from Human Preferences.P. Christiano, J. Leike, T. Brown, M. Martic, S. Legg, und D. Amodei. NIPS, Seite 4299-4307. (2017)

BibSonomy

Disambiguierung von "Christiano, Paul"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Recursively Summarizing Books with Human Feedback

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Christiano German

Christiano Pesavento

Christiano German

Christiano German

Christiano German

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Christiano, Paul"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Recursively Summarizing Books with Human Feedback

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Christiano German

Christiano Pesavento

Christiano German

Christiano German

Christiano German

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Recursively Summarizing Books with Human Feedback