Autor der Publikation

Software-Hardware Co-design of Heterogeneous SmartNIC System for Recommendation Models Inference and Training.

, , , , , , , , , und . ICS, Seite 336-347. ACM, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Workshop 8: AsHES Accelerators and Hybrid Exascale Systems., , und . IPDPS Workshops, Seite 430. IEEE, (2020)PiP-MColl: Process-in-Process-based Multi-object MPI Collectives., , , , , , , , , und 1 andere Autor(en). CLUSTER, Seite 354-364. IEEE, (2023)Parallel I/O Optimizations for Scalable Deep Learning., , , und . ICPADS, Seite 720-729. IEEE Computer Society, (2017)Design of Direct Communication Facility for Many-Core Based Accelerators., und . IPDPS Workshops, Seite 924-929. IEEE Computer Society, (2012)Introduction to AsHES 2018., , und . IPDPS Workshops, Seite 520. IEEE Computer Society, (2018)Special Issue on Programming Models and Applications for Multicores and Manycores 2020., , und . Concurr. Comput. Pract. Exp., (2022)Software combining to mitigate multithreaded MPI contention., , , , , , , , , und 6 andere Autor(en). ICS, Seite 367-379. ACM, (2019)Daps: A Dynamic Asynchronous Progress Stealing Model for MPI Communication., , , , und . CLUSTER, Seite 516-527. IEEE, (2021)Why is MPI so slow?: analyzing the fundamental limits in implementing MPI-3.1., , , , , , , , , und 18 andere Autor(en). SC, Seite 62. ACM, (2017)Scaling NWChem with Efficient and Portable Asynchronous Communication in MPI RMA., , , , und . CCGRID, Seite 811-816. IEEE Computer Society, (2015)