Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Benanza: Automatic μBenchmark Generation to Compute "Lower-bound" Latency and Inform Optimizations of Deep Learning Models on GPUs., , , und . CoRR, (2019)Enhancing the Usability and Utilization of Accelerated Architectures via Docker., , , , , , und . UCC, Seite 361-367. IEEE Computer Society, (2015)RAI: A Scalable Project Submission System for Parallel Programming Courses., , , und . IPDPS Workshops, Seite 315-322. IEEE Computer Society, (2017)Triolet: a programming system that unifies algorithmic skeleton interfaces for high-performance cluster computing., , , und . PPoPP, Seite 247-258. ACM, (2014)Across-Stack Profiling and Characterization of Machine Learning Models on GPUs., , , , , und . CoRR, (2019)Challenges and Pitfalls of Reproducing Machine Learning Artifacts., , , und . CoRR, (2019)The Design and Implementation of a Scalable DL Benchmarking Platform., , , und . CoRR, (2019)FFT blitz: the tensor cores strike back., , , , und . PPoPP, Seite 488-489. ACM, (2021)Accelerating reduction and scan using tensor core units., , , , und . ICS, Seite 46-57. ACM, (2019)TrIMS: Transparent and Isolated Model Sharing for Low Latency Deep Learning Inference in Function-as-a-Service., , , , und . CLOUD, Seite 372-382. IEEE, (2019)