Autor der Publikation

Benchmarking the Memory Hierarchy of Modern GPUs.

, , , und . NPC, Volume 8707 von Lecture Notes in Computer Science, Seite 144-156. Springer, (2014)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Decoupling the All-Reduce Primitive for Accelerating Distributed Deep Learning., , , , , und . CoRR, (2023)Benchmarking the Memory Hierarchy of Modern GPUs., , , und . NPC, Volume 8707 von Lecture Notes in Computer Science, Seite 144-156. Springer, (2014)The Design and Implementation of OMPit: An OpenMP Compiler Characterized by Logs for Parallel and Work-Sharing., , , und . PAAP, Seite 350-355. IEEE Computer Society, (2011)Towards more efficient ophthalmic disease classification and lesion location via convolution transformer., , , , , , , , und . Comput. Methods Programs Biomed., (2022)The System of Distribution Network Live Working Robot Based on Multi-level Insulation Design and Human-machine Collaboration., , , und . RICAI, Seite 272-276. ACM, (2022)GPGPU performance estimation for frequency scaling using cross-benchmarking., , und . GPGPU@PPoPP, Seite 31-40. ACM, (2020)A Quantitative Survey of Communication Optimizations in Distributed Deep Learning., , , , , und . IEEE Netw., 35 (3): 230-237 (2021)Quantitatively Measuring the Memory Locality Leakage on NUMA Systems Based on Instruction-Based-Sampling., , , und . PDCAT, Seite 251-256. IEEE, (2012)Understanding the Data Traffic of Uncore in Westmere NUMA Architecture., , , , und . PDP, Seite 392-399. IEEE Computer Society, (2014)ScheMoE: An Extensible Mixture-of-Experts Distributed Training System with Tasks Scheduling., , , , , , , , und . EuroSys, Seite 236-249. ACM, (2024)