,

Why is parameter averaging beneficial in SGD? An objective smoothing perspective.

, , , и .
AISTATS, том 238 из Proceedings of Machine Learning Research, стр. 3565-3573. PMLR, (2024)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии