Autor der Publikation

Evaluating and optimizing OpenCL kernels for high performance computing with FPGAs.

, , , , und . SC, Seite 409-420. IEEE Computer Society, (2016)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

From FLOPS to BYTES: disruptive change in high-performance computing towards the post-moore era., , , , , , , , , und 1 andere Autor(en). Conf. Computing Frontiers, Seite 274-281. ACM, (2016)Scaling FMM with Data-Driven OpenMP Tasks on Multicore Architectures., , , , , , und . IWOMP, Volume 9903 von Lecture Notes in Computer Science, Seite 156-170. (2016)Highly optimized full GPU-acceleration of non-hydrostatic weather model SCALE-LES., und . CLUSTER, Seite 1-8. IEEE Computer Society, (2013)Poster: fast GPU read alignment with burrows wheeler transform based index., , und . SC Companion, Seite 21-22. ACM, (2011)Effective Quantization Approaches for Recurrent Neural Networks., , , , und . IJCNN, Seite 1-8. IEEE, (2018)Scalable Kernel Fusion for Memory-Bound GPU Applications., und . SC, Seite 191-202. IEEE Computer Society, (2014)Data-centric GPU-based adaptive mesh refinement., und . IA3@SC, Seite 3:1-3:7. ACM, (2015)A Low Power ΔΣ Modulator with Low Voltage OTA for Wearable Applications., und . ICM, Seite 1-5. IEEE, (2024)CUDA vs OpenACC: Performance Case Studies with Kernel Benchmarks and a Memory-Bound CFD Application., , , und . CCGRID, Seite 136-143. IEEE Computer Society, (2013)Peta-scale phase-field simulation for dendritic solidification on the TSUBAME 2.0 supercomputer., , , , , , , und . SC, Seite 3:1-3:11. ACM, (2011)