Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time.

M. Wortsman, G. Ilharco, S. Gadre, R. Roelofs, R. Lopes, A. Morcos, H. Namkoong, A. Farhadi, Y. Carmon, S. Kornblith, und L. Schmidt. ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 23965-23998. PMLR, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Daniell Mitchell

Gail Mitchell

Brian Mitchell

Margaret Mitchell

John Mitchell

Weitere Publikationen von Autoren mit dem selben Namen

LAION-5B: An open large-scale dataset for training next generation image-text models.C. Schuhmann, R. Beaumont, R. Vencu, C. Gordon, R. Wightman, M. Cherti, T. Coombes, A. Katta, C. Mullis, M. Wortsman und 6 andere Autor(en). NeurIPS, (2022)Robust fine-tuning of zero-shot models.M. Wortsman, G. Ilharco, M. Li, J. Kim, H. Hajishirzi, A. Farhadi, H. Namkoong, und L. Schmidt. CoRR, (2021)OLMo: Accelerating the Science of Language Models.D. Groeneveld, I. Beltagy, P. Walsh, A. Bhagia, R. Kinney, O. Tafjord, A. Jha, H. Ivison, I. Magnusson, Y. Wang und 33 andere Autor(en). CoRR, (2024)Scaling Exponents Across Parameterizations and Optimizers.K. Everett, L. Xiao, M. Wortsman, A. Alemi, R. Novak, P. Liu, I. Gur, J. Sohl-Dickstein, L. Kaelbling, J. Lee und 1 andere Autor(en). ICML, OpenReview.net, (2024)Reproducible Scaling Laws for Contrastive Language-Image Learning.M. Cherti, R. Beaumont, R. Wightman, M. Wortsman, G. Ilharco, C. Gordon, C. Schuhmann, L. Schmidt, und J. Jitsev. CVPR, Seite 2818-2829. IEEE, (2023)What's Hidden in a Randomly Weighted Neural Network?V. Ramanujan, M. Wortsman, A. Kembhavi, A. Farhadi, und M. Rastegari. CVPR, Seite 11890-11899. Computer Vision Foundation / IEEE, (2020)Learning to Learn How to Learn: Self-Adaptive Visual Navigation Using Meta-Learning.M. Wortsman, K. Ehsani, M. Rastegari, A. Farhadi, und R. Mottaghi. CVPR, Seite 6750-6759. Computer Vision Foundation / IEEE, (2019)Discovering Neural Wirings.M. Wortsman, A. Farhadi, und M. Rastegari. NeurIPS, Seite 2680-2690. (2019)Resolving Discrepancies in Compute-Optimal Scaling of Language Models.T. Porian, M. Wortsman, J. Jitsev, L. Schmidt, und Y. Carmon. CoRR, (2024)Small-scale proxies for large-scale Transformer training instabilities.M. Wortsman, P. Liu, L. Xiao, K. Everett, A. Alemi, B. Adlam, J. Co-Reyes, I. Gur, A. Kumar, R. Novak und 6 andere Autor(en). ICLR, OpenReview.net, (2024)

BibSonomy

Disambiguierung von "Wortsman, Mitchell"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Daniell Mitchell

Gail Mitchell

Brian Mitchell

Margaret Mitchell

John Mitchell

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Wortsman, Mitchell"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Daniell Mitchell

Gail Mitchell

Brian Mitchell

Margaret Mitchell

John Mitchell

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time.