,

SWARM Parallelism: Training Large Models Can Be Surprisingly Communication-Efficient.

M. Ryabinin, T. Dettmers, M. Diskin, и A. Borzunov.
ICML, том 202 из Proceedings of Machine Learning Research, стр. 29416-29440. PMLR, (2023)

Метаданные

ключ BibTeX: conf/icml/RyabininDDB23
тип записи: inproceedings
название книги: ICML
год: 2023
страницы: 29416-29440
издательство: PMLR
серии: Proceedings of Machine Learning Research
том: 202
Перекрестная ссылка BibTeX: conf/icml/2023
ee: https://proceedings.mlr.press/v202/ryabinin23a.html
url: http://dblp.uni-trier.de/db/conf/icml/icml2023.html#RyabininDDB23

тэги

dblp

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

Цитировать эту публикацию

искать в

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter