Autor der Publikation

Clock Delivery Network Design and Analysis for Interposer-Based 2.5-D Heterogeneous Systems.

, , , , , , , und . IEEE Trans. Very Large Scale Integr. Syst., 29 (4): 605-616 (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Merge Network for a Non-Von Neumann Accumulate Accelerator in a 3D Chip., , , und . ICRC, Seite 1-11. IEEE, (2018)ASTRA-SIM: Enabling SW/HW Co-Design Exploration for Distributed DL Training Platforms., , , und . ISPASS, Seite 81-92. IEEE, (2020)ATTACC the Quadratic Bottleneck of Attention Layers., , , und . CoRR, (2021)Exploring Multi-dimensional Hierarchical Network Topologies for Efficient Distributed Training of Trillion Parameter DL Models., , , und . CoRR, (2021)Evaluating Spatial Accelerator Architectures with Tiled Matrix-Matrix Multiplication., , , , , und . IEEE Trans. Parallel Distributed Syst., 33 (4): 1002-1014 (2022)The gem5 Simulator: Version 20.0+., , , , , , , , , und 63 andere Autor(en). CoRR, (2020)STIFT: A Spatio-Temporal Integrated Folding Tree for Efficient Reductions in Flexible DNN Accelerators., , , und . ACM J. Emerg. Technol. Comput. Syst., 19 (4): 32:1-32:20 (Oktober 2023)RASA: Efficient Register-Aware Systolic Array Matrix Engine for CPU., , , , , , und . DAC, Seite 253-258. IEEE, (2021)Self adaptive reconfigurable arrays (SARA): learning flexible GEMM accelerator configuration and mapping-space using ML., , , und . DAC, Seite 583-588. ACM, (2022)Themis: a network bandwidth-aware collective scheduling policy for distributed training of DL models., , , , und . ISCA, Seite 581-596. ACM, (2022)