From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

DeepSpeed4Science Initiative: Enabling Large-Scale Scientific Discovery through Sophisticated AI System Technologies.

S. Song, B. Kruft, M. Zhang, C. Li, S. Chen, C. Zhang, M. Tanaka, X. Wu, J. Rasley, A. Awan, C. Holmes, M. Cai, A. Ghanem, Z. Zhou, Y. He, P. Luferenko, D. Kumar, J. Weyn, R. Zhang, S. Klocek, V. Vragov, M. AlQuraishi, G. Ahdritz, C. Floristean, C. Negri, R. Kotamarthi, V. Vishwanath, A. Ramanathan, S. Foreman, K. Hippe, T. Arcomano, R. Maulik, M. Zvyagin, A. Brace, B. Zhang, C. Bohorquez, A. Clyde, B. Kale, D. Perez-Rivera, H. Ma, C. Mann, M. Irvin, J. Pauloski, L. Ward, V. Hayot-Sasson, M. Emani, Z. Xie, D. Lin, M. Shukla, I. Foster, J. Davis, M. Papka, T. Brettin, P. Balaprakash, G. Tourassi, J. Gounley, H. Hanson, T. Potok, M. Pasini, K. Evans, D. Lu, D. Lunga, J. Yin, S. Dash, F. Wang, M. Shankar, I. Lyngaas, X. Wang, G. Cong, P. Zhang, M. Fan, S. Liu, A. Hoisie, S. Yoo, Y. Ren, W. Tang, K. Felker, A. Svyatkovskiy, H. Liu, A. Aji, A. Dalton, M. Schulte, K. Schulz, Y. Deng, W. Nie, J. Romero, C. Dallago, A. Vahdat, C. Xiao, T. Gibbs, A. Anandkumar, и R. Stevens. CoRR, (2023)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Ammar Ahmad

Ammar Ammar

Maha Ammar

Normah Awang Besar Raffie

Usman Khalid Awan

Другие публикации лиц с тем же именем

1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed.C. Li, A. Awan, H. Tang, S. Rajbhandari, и Y. He. HIPC, стр. 272-281. IEEE, (2022)OC-DNN: Exploiting Advanced Unified Memory Capabilities in CUDA 9 and Volta GPUs for Out-of-Core DNN Training.A. Awan, C. Chu, H. Subramoni, X. Lu, и D. Panda. HiPC, стр. 143-152. IEEE, (2018)Efficient and Scalable Multi-Source Streaming Broadcast on GPU Clusters for Deep Learning.C. Chu, X. Lu, A. Awan, H. Subramoni, J. Hashmi, B. Elton, и D. Panda. ICPP, стр. 161-170. IEEE Computer Society, (2017)An In-depth Performance Characterization of CPU- and GPU-based DNN Training on Modern Architectures.A. Awan, H. Subramoni, и D. Panda. MLHPC@SC, стр. 8:1-8:8. ACM, (2017)Intercloud message exchange middleware.M. Amin, W. Khan, A. Awan, и S. Lee. ICUIMC, стр. 79:1-79:7. ACM, (2012)MCR-DL: Mix-and-Match Communication Runtime for Deep Learning.Q. Anthony, A. Awan, J. Rasley, Y. He, A. Shafi, M. Abduljabbar, H. Subramoni, и D. Panda. IPDPS, стр. 996-1006. IEEE, (2023)High performance distributed deep learning: a beginner's guide.D. Panda, A. Awan, и H. Subramoni. PPoPP, стр. 452-454. ACM, (2019)DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale.S. Rajbhandari, C. Li, Z. Yao, M. Zhang, R. Aminabadi, A. Awan, J. Rasley, и Y. He. ICML, том 162 из Proceedings of Machine Learning Research, стр. 18332-18346. PMLR, (2022)Optimized Broadcast for Deep Learning Workloads on Dense-GPU InfiniBand Clusters: MPI or NCCL?A. Awan, C. Chu, H. Subramoni, и D. Panda. EuroMPI, стр. 2:1-2:9. ACM, (2018)Efficient Training of Semantic Image Segmentation on Summit using Horovod and MVAPICH2-GDR.Q. Anthony, A. Awan, A. Jain, H. Subramoni, и D. Panda. IPDPS Workshops, стр. 1015-1023. IEEE, (2020)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter