Autor der Publikation

Optimizing Memory-Bound SYMV Kernel on GPU Hardware Accelerators.

, , , und . VECPAR, Volume 7851 von Lecture Notes in Computer Science, Seite 72-79. Springer, (2012)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Evaluating the Performance of NVIDIA's A100 Ampere GPU for Sparse and Batched Computations., , , , und . PMBS@SC, Seite 26-38. IEEE, (2020)High Performance Multi-GPU SpMV for Multi-component PDE-Based Applications., , und . Euro-Par, Volume 9233 von Lecture Notes in Computer Science, Seite 601-612. Springer, (2015)Portable and Efficient Dense Linear Algebra in the Beginning of the Exascale Era., , , , , , , , und . P3HPC@SC, Seite 36-46. IEEE, (2022)Design, Optimization, and Benchmarking of Dense Linear Algebra Algorithms on AMD GPUs., , , und . HPEC, Seite 1-7. IEEE, (2020)Progressive Optimization of Batched LU Factorization on GPUs., , und . HPEC, Seite 1-6. IEEE, (2019)Performance optimization of Sparse Matrix-Vector Multiplication for multi-component PDE-based applications using GPUs., , , und . Concurr. Comput. Pract. Exp., 28 (12): 3447-3465 (2016)Optimizing Memory-Bound SYMV Kernel on GPU Hardware Accelerators., , , und . VECPAR, Volume 7851 von Lecture Notes in Computer Science, Seite 72-79. Springer, (2012)Performance Tuning and Optimization Techniques of Fixed and Variable Size Batched Cholesky Factorization on GPUs., , , und . ICCS, Volume 80 von Procedia Computer Science, Seite 119-130. Elsevier, (2016)GPU-based LU Factorization and Solve on Batches of Matrices with Band Structure., , , , und . SC Workshops, Seite 1670-1679. ACM, (2023)A survey of numerical linear algebra methods utilizing mixed-precision arithmetic., , , , , , , , , und 11 andere Autor(en). Int. J. High Perform. Comput. Appl., (2021)