Autor der Publikation

Design and Implementation of the PULSAR Programming System for Large Scale Computing.

, , , , und . Supercomput. Front. Innov., 4 (1): 4-26 (2017)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Implementation and Tuning of Batched Cholesky Factorization and Solve for NVIDIA GPUs., , , und . IEEE Trans. Parallel Distributed Syst., 27 (7): 2036-2048 (2016)Experiences in autotuning matrix multiplication for energy minimization on GPUs., , , , und . Concurr. Comput. Pract. Exp., 27 (17): 5096-5113 (2015)Fast and Small Short Vector SIMD Matrix Multiplication Kernels for the Synergistic Processing Element of the CELL Processor., , und . ICCS (1), Volume 5101 von Lecture Notes in Computer Science, Seite 935-944. Springer, (2008)Autotuning Techniques for Performance-Portable Point Set Registration in 3D., , , , , und . Supercomput. Front. Innov., 5 (4): 42-61 (2018)Design and Implementation of the PULSAR Programming System for Large Scale Computing., , , , und . Supercomput. Front. Innov., 4 (1): 4-26 (2017)Accelerating Scientific Computations with Mixed Precision Algorithms, , , , , , , und . CoRR, (2008)Parallel Simulation of Superscalar Scheduling., , , , und . ICPP, Seite 121-130. IEEE Computer Society, (2014)An improved parallel singular value algorithm and its implementation for multicore hardware., , und . SC, Seite 90:1-90:12. ACM, (2013)Prospectus for the Next LAPACK and ScaLAPACK Libraries., , , , , , , , , und 7 andere Autor(en). PARA, Volume 4699 von Lecture Notes in Computer Science, Seite 11-23. Springer, (2006)Search Space Generation and Pruning System for Autotuners., , , , und . IPDPS Workshops, Seite 1545-1554. IEEE Computer Society, (2016)