Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed.

C. Li, A. Awan, H. Tang, S. Rajbhandari, und Y. He. HIPC, Seite 272-281. IEEE, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Ammar Ahmad

Ammar Ammar

Maha Ammar

Normah Awang Besar Raffie

Usman Khalid Awan

Weitere Publikationen von Autoren mit dem selben Namen

Exploiting Hardware Multicast and GPUDirect RDMA for Efficient Broadcast.C. Chu, X. Lu, A. Awan, H. Subramoni, B. Elton, und D. Panda. IEEE Trans. Parallel Distributed Syst., 30 (3): 575-588 (2019)Optimized Broadcast for Deep Learning Workloads on Dense-GPU InfiniBand Clusters: MPI or NCCL?A. Awan, C. Chu, H. Subramoni, und D. Panda. CoRR, (2017)A Novel Tensor-Expert Hybrid Parallelism Approach to Scale Mixture-of-Experts Training.S. Singh, O. Ruwase, A. Awan, S. Rajbhandari, Y. He, und A. Bhatele. CoRR, (2023)1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed.C. Li, A. Awan, H. Tang, S. Rajbhandari, und Y. He. HIPC, Seite 272-281. IEEE, (2022)OC-DNN: Exploiting Advanced Unified Memory Capabilities in CUDA 9 and Volta GPUs for Out-of-Core DNN Training.A. Awan, C. Chu, H. Subramoni, X. Lu, und D. Panda. HiPC, Seite 143-152. IEEE, (2018)Efficient and Scalable Multi-Source Streaming Broadcast on GPU Clusters for Deep Learning.C. Chu, X. Lu, A. Awan, H. Subramoni, J. Hashmi, B. Elton, und D. Panda. ICPP, Seite 161-170. IEEE Computer Society, (2017)An In-depth Performance Characterization of CPU- and GPU-based DNN Training on Modern Architectures.A. Awan, H. Subramoni, und D. Panda. MLHPC@SC, Seite 8:1-8:8. ACM, (2017)Intercloud message exchange middleware.M. Amin, W. Khan, A. Awan, und S. Lee. ICUIMC, Seite 79:1-79:7. ACM, (2012)Communication Profiling and Characterization of Deep-Learning Workloads on Clusters With High-Performance Interconnects.A. Awan, A. Jain, C. Chu, H. Subramoni, und D. Panda. IEEE Micro, 40 (1): 35-43 (2020)DeepSpeed-Chat: Easy, Fast and Affordable RLHF Training of ChatGPT-like Models at All Scales.Z. Yao, R. Aminabadi, O. Ruwase, S. Rajbhandari, X. Wu, A. Awan, J. Rasley, M. Zhang, C. Li, C. Holmes und 9 andere Autor(en). CoRR, (2023)

BibSonomy

Disambiguierung von "Awan, Ammar Ahmad"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Ammar Ahmad

Ammar Ammar

Maha Ammar

Normah Awang Besar Raffie

Usman Khalid Awan

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Awan, Ammar Ahmad"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML 1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Ammar Ahmad

Ammar Ammar

Maha Ammar

Normah Awang Besar Raffie

Usman Khalid Awan

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed.