Autor der Publikation

Parallel Sparse Matrix-Vector Multiplication as a Test Case for Hybrid MPI+OpenMP Programming.

, , , und . IPDPS Workshops, Seite 1751-1758. IEEE, (2011)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Opening the Black Box: Performance Estimation during Code Generation for GPUs., , , , und . SBAC-PAD, Seite 22-32. IEEE, (2021)SPEChpc 2021 Benchmarks on Ice Lake and Sapphire Rapids Infiniband Clusters: A Performance and Energy Case Study., , und . SC Workshops, Seite 1245-1254. ACM, (2023)Propagation and Decay of Injected One-Off Delays on Clusters: A Case Study., , und . CLUSTER, Seite 1-10. IEEE, (2019)Optimization of an Electromagnetics Code with Multicore Wavefront Diamond Blocking and Multi-dimensional Intra-Tile Parallelization., , , , , und . IPDPS, Seite 142-151. IEEE Computer Society, (2016)The world's fastest CPU and SMP node: Some performance results from the NEC SX-9., , und . IPDPS, Seite 1-8. IEEE, (2009)Comparison of different propagation steps for lattice Boltzmann methods., , , und . Comput. Math. Appl., 65 (6): 924-935 (2013)Making Applications Faster by Asynchronous Execution: Slowing Down Processes or Relaxing MPI Collectives., , , und . CoRR, (2023)Performance Engineering for a Tall & Skinny Matrix Multiplication Kernel on GPUs., , , und . CoRR, (2019)Performance Modeling of Streaming Kernels and Sparse Matrix-Vector Multiplication on A64FX., , , , , , und . PMBS@SC, Seite 1-7. IEEE, (2020)Core-Level Performance Engineering with the Open-Source Architecture Code Analyzer (OSACA) and the Compiler Explorer., und . ICPE (Companion), Seite 127-131. ACM, (2023)