Autor der Publikation

The Implicit Bias of Gradient Descent on Separable Data

, , , , und . (2017)cite arxiv:1710.10345Comment: Final JMLR version, with improved discussions over v3. Main improvements in journal version over conference version (v2 appeared in ICLR): We proved the measure zero case for main theorem (with implications for the rates), and the multi-class case.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Regularization Guarantees Generalization in Bayesian Reinforcement Learning through Algorithmic Stability., , und . AAAI, Seite 8423-8431. AAAI Press, (2022)Physics-Aware Downsampling with Deep Learning for Scalable Flood Modeling., , , , und . NeurIPS, Seite 1378-1389. (2021)Accurate Post Training Quantization With Small Calibration Sets., , , , und . ICML, Volume 139 von Proceedings of Machine Learning Research, Seite 4466-4475. PMLR, (2021)Exponentially vanishing sub-optimal local minima in multilayer neural networks., und . ICLR (Workshop), OpenReview.net, (2018)The Implicit Bias of Gradient Descent on Separable Data., , , , und . J. Mach. Learn. Res., (2018)Scaling FP8 training to trillion-token LLMs., , , und . CoRR, (2024)History dependent dynamics in a generic model of ion channels - an analytic study, und . (2009)cite arxiv:0912.4060.How do infinite width bounded norm networks look in function space?, , , und . COLT, Volume 99 von Proceedings of Machine Learning Research, Seite 2667-2690. PMLR, (2019)Training Binary Multilayer Neural Networks for Image Classification using Expectation Backpropagation., , , und . CoRR, (2015)Minimum Variance Unbiased N: M Sparsity for the Neural Gradients., , , und . ICLR, OpenReview.net, (2023)