Autor der Publikation

Designing a Profiling and Visualization Tool for Scalable and In-depth Analysis of High-Performance GPU Clusters.

, , , , , , , und . HiPC, Seite 93-102. IEEE, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Dynamic Kernel Fusion for Bulk Non-contiguous Data Transfer on GPU Clusters., , , , und . CLUSTER, Seite 130-141. IEEE, (2020)Optimized Broadcast for Deep Learning Workloads on Dense-GPU InfiniBand Clusters: MPI or NCCL?, , , und . EuroMPI, Seite 2:1-2:9. ACM, (2018)OC-DNN: Exploiting Advanced Unified Memory Capabilities in CUDA 9 and Volta GPUs for Out-of-Core DNN Training., , , , und . HiPC, Seite 143-152. IEEE, (2018)Efficient and Scalable Multi-Source Streaming Broadcast on GPU Clusters for Deep Learning., , , , , , und . ICPP, Seite 161-170. IEEE Computer Society, (2017)Better Together: Jointly Optimizing ML Collective Scheduling and Execution Planning using SYNDICATE., , , und . NSDI, Seite 809-824. USENIX Association, (2023)Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression., , , , , , , , , und 2 andere Autor(en). CoRR, (2024)Scalable Distributed DNN Training using TensorFlow and CUDA-Aware MPI: Characterization, Designs, and Performance Evaluation., , , , und . CoRR, (2018)Designing High-Performance In-Memory Key-Value Operations with Persistent GPU Kernels and OpenSHMEM., , , , , und . OpenSHMEM, Seite 148-164. Springer, (2018)Designing a Profiling and Visualization Tool for Scalable and In-depth Analysis of High-Performance GPU Clusters., , , , , , , und . HiPC, Seite 93-102. IEEE, (2019)The Llama 3 Herd of Models, , , , , , , , , und 523 andere Autor(en). (2024)