Autor der Publikation

An Investigation into Neural Net Optimization via Hessian Eigenvalue Density.

, , und . ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 2232-2241. PMLR, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

A Loss Curvature Perspective on Training Instabilities of Deep Learning Models., , , , , , , , und . ICLR, OpenReview.net, (2022)Scaling Laws for Neural Machine Translation., , , , , , , und . ICLR, OpenReview.net, (2022)Data Scaling Laws in NMT: The Effect of Noise and Architecture., , , , , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 1466-1482. PMLR, (2022)An Investigation into Neural Net Optimization via Hessian Eigenvalue Density., , und . ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 2232-2241. PMLR, (2019)Linearized two-layers neural networks in high dimension., , , und . CoRR, (2019)Examining Scaling and Transfer of Language Model Architectures for Machine Translation., , , , , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 26176-26192. PMLR, (2022)Epsilon Sampling Rocks: Investigating Sampling Strategies for Minimum Bayes Risk Decoding for Machine Translation., , und . EMNLP (Findings), Seite 9198-9209. Association for Computational Linguistics, (2023)Binarized Neural Machine Translation., , , , , , und . CoRR, (2023)Limitations of Lazy Training of Two-layers Neural Networks, , , und . (2019)cite arxiv:1906.08899Comment: 39 pages; 2 pdf figures.Scaling Laws for Multilingual Neural Machine Translation., , , , und . ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 10053-10071. PMLR, (2023)