Autor der Publikation

HINT: Designing Cache-Efficient MPI_Alltoall using Hybrid Memory Copy Ordering and Non-Temporal Instructions.

, , , , , , , und . IPDPS, Seite 802-813. IEEE, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Designing In-network Computing Aware Reduction Collectives in MPI., , , , , , , , und . HOTI, Seite 25-32. IEEE, (2023)AccDP: Accelerated Data-Parallel Distributed DNN Training for Modern GPU-Based HPC Clusters., , , , und . HIPC, Seite 32-41. IEEE, (2022)Accelerating Large Language Model Training with Hybrid GPU-based Compression., , , , , , , und . CCGrid, Seite 196-205. IEEE, (2024)Performance Characterization of Using Quantization for DNN Inference on Edge Devices., , , , , , und . ICFEC, Seite 1-6. IEEE, (2023)HINT: Designing Cache-Efficient MPI_Alltoall using Hybrid Memory Copy Ordering and Non-Temporal Instructions., , , , , , , und . IPDPS, Seite 802-813. IEEE, (2024)OMB-Py: Python Micro-Benchmarks for Evaluating Performance of MPI Libraries on HPC Systems., , , , und . IPDPS Workshops, Seite 870-879. IEEE, (2022)HARVEST: High-Performance Artificial Vision Framework for Expert Labeling using Semi-Supervised Training., , , , , und . IEEE Big Data, Seite 139-148. IEEE, (2023)Flover: A Temporal Fusion Framework for Efficient Autoregressive Model Parallel Inference., , , , , und . HiPC, Seite 107-116. IEEE, (2023)Optimizing Distributed DNN Training Using CPUs and BlueField-2 DPUs., , , , und . IEEE Micro, 42 (2): 53-60 (2022)Accelerating CPU-based Distributed DNN Training on Modern HPC Clusters using BlueField-2 DPUs., , , , und . HOTI, Seite 17-24. IEEE, (2021)