Autor der Publikation

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time.

, , , , , , , , , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 23965-23998. PMLR, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

LAION-5B: An open large-scale dataset for training next generation image-text models., , , , , , , , , und 6 andere Autor(en). NeurIPS, (2022)Robust fine-tuning of zero-shot models., , , , , , , und . CoRR, (2021)OLMo: Accelerating the Science of Language Models., , , , , , , , , und 33 andere Autor(en). CoRR, (2024)Scaling Exponents Across Parameterizations and Optimizers., , , , , , , , , und 1 andere Autor(en). ICML, OpenReview.net, (2024)Reproducible Scaling Laws for Contrastive Language-Image Learning., , , , , , , , und . CVPR, Seite 2818-2829. IEEE, (2023)What's Hidden in a Randomly Weighted Neural Network?, , , , und . CVPR, Seite 11890-11899. Computer Vision Foundation / IEEE, (2020)Learning to Learn How to Learn: Self-Adaptive Visual Navigation Using Meta-Learning., , , , und . CVPR, Seite 6750-6759. Computer Vision Foundation / IEEE, (2019)Discovering Neural Wirings., , und . NeurIPS, Seite 2680-2690. (2019)Resolving Discrepancies in Compute-Optimal Scaling of Language Models., , , , und . CoRR, (2024)Small-scale proxies for large-scale Transformer training instabilities., , , , , , , , , und 6 andere Autor(en). ICLR, OpenReview.net, (2024)