Autor der Publikation

The Next 700 Accelerated Layers: From Mathematical Expressions of Network Computation Graphs to Accelerated GPU Kernels, Automatically.

, , , , , , , , und . ACM Trans. Archit. Code Optim., 16 (4): 38:1-38:26 (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Tapir: Embedding Recursive Fork-join Parallelism into LLVM's Intermediate Representation., , und . ACM Trans. Parallel Comput., 6 (4): 19:1-19:33 (2019)AutoPhase: Compiler Phase-Ordering for High Level Synthesis with Deep Reinforcement Learning., , , , , , und . CoRR, (2019)Understanding Automatic Differentiation Pitfalls., , , , , und . CoRR, (2023)Tapir: Embedding Fork-Join Parallelism into LLVM's Intermediate Representation., , und . PPoPP, Seite 249-265. ACM, (2017)High-Performance GPU-to-CPU Transpilation and Optimization via High-Level Parallel Constructs., , , , , und . CoRR, (2022)The Quantum Tortoise and the Classical Hare: A simple framework for understanding which problems quantum computing will accelerate (and which it will not)., , und . CoRR, (2023)Retargeting and Respecializing GPU Workloads for Performance Portability., , , , und . CGO, Seite 119-132. IEEE, (2024)Instead of Rewriting Foreign Code for Machine Learning, Automatically Synthesize Fast Gradients., und . NeurIPS, (2020)High-Performance GPU-to-CPU Transpilation and Optimization via High-Level Parallel Constructs., , , , , und . PPoPP, Seite 119-134. ACM, (2023)Scalable Automatic Differentiation of Multiple Parallel Paradigms through Compiler Augmentation., , , , , , , und . SC, Seite 60:1-60:18. IEEE, (2022)