Autor der Publikation

Automated Transformation of GPU-Specific OpenCL Kernels Targeting Performance Portability on Multi-Core/Many-Core CPUs.

, , , , , , , und . Euro-Par, Volume 8632 von Lecture Notes in Computer Science, Seite 210-221. Springer, (2014)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Optimizing OpenCL Implementation of Deep Convolutional Neural Network on FPGA., , , , , und . NPC, Volume 10578 von Lecture Notes in Computer Science, Seite 100-111. Springer, (2017)ACF: Networks-on-Chip Deadlock Recovery with Accurate Detection and Elastic Credit., , , und . APPT, Volume 8299 von Lecture Notes in Computer Science, Seite 319-333. Springer, (2013)Automated Transformation of GPU-Specific OpenCL Kernels Targeting Performance Portability on Multi-Core/Many-Core CPUs., , , , , , , und . Euro-Par, Volume 8632 von Lecture Notes in Computer Science, Seite 210-221. Springer, (2014)Towards a Uniform Template-based Architecture for Accelerating 2D and 3D CNNs on FPGA., , , , , und . FPGA, Seite 97-106. ACM, (2018)Towards a Multi-array Architecture for Accelerating Large-scale Matrix Multiplication on FPGAs., , , , und . ISCAS, Seite 1-5. IEEE, (2018)Unified Virtual Memory Support for Deep CNN Accelerator on SoC FPGA., , , , und . ICA3PP (1), Volume 9528 von Lecture Notes in Computer Science, Seite 64-76. Springer, (2015)