Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Drinking from both glasses: combining pessimistic and optimistic tracking of cross-thread dependences., , , und . PPoPP, Seite 20:1-20:13. ACM, (2016)The Stability-Efficiency Dilemma: Investigating Sequence Length Warmup for Training GPT Models., , und . NeurIPS, (2022)NxMTransformer: Semi-Structured Sparsification for Natural Language Understanding via ADMM., , , und . NeurIPS, Seite 1818-1830. (2021)Model Tells You What to Discard: Adaptive KV Cache Compression for LLMs., , , , , und . CoRR, (2023)Model Tells You Where to Merge: Adaptive KV Cache Merging for LLMs on Long-Context Tasks., , , und . CoRR, (2024)System Optimizations for Enabling Training of Extreme Long Sequence Transformer Models., , , , , , , und . PODC, Seite 121-130. ACM, (2024)Maximizing Communication Efficiency for Large-scale Training via 0/1 Adam., , , , und . ICLR, OpenReview.net, (2023)OCTET: capturing and controlling cross-thread dependences efficiently., , , , , , , und . OOPSLA, Seite 693-712. ACM, (2013)DL Inference and Training Optimization Towards Speed and Scale.. WWW (Companion Volume), Seite 192. ACM / IW3C2, (2021)Hybridizing and Relaxing Dependence Tracking for Efficient Parallel Runtime Support., , , , und . ACM Trans. Parallel Comput., 4 (2): 9:1-9:42 (2017)