Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

SM6: A 16nm System-on-Chip for Accurate and Noise-Robust Attention-Based NLP Applications : The 33rd Hot Chips Symposium - August 22-24, 2021., , , , , , , , , und . HCS, Seite 1-13. IEEE, (2021)A 16-nm SoC for Noise-Robust Speech and NLP Edge AI Inference With Bayesian Sound Source Separation and Attention-Based DNNs., , , , , , , , , und . IEEE J. Solid State Circuits, 58 (2): 569-581 (Februar 2023)Learned Best-Effort LLM Serving., , , , und . CoRR, (2024)Full Stack Optimization of Transformer Inference: a Survey., , , , , , , , , und 2 andere Autor(en). CoRR, (2023)EdgeBERT: Optimizing On-Chip Inference for Multi-Task NLP., , , , , , , , und . CoRR, (2020)AI and Memory Wall., , , , , und . CoRR, (2024)Property-Aware Multi-Speaker Data Simulation: A Probabilistic Modelling Technique for Synthetic Data Generation., , , , , , , und . CoRR, (2023)KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization., , , , , , und . CoRR, (2024)SPEED: Speculative Pipelined Execution for Efficient Decoding., , , , , , und . CoRR, (2023)A 12nm 18.1TFLOPs/W Sparse Transformer Processor with Entropy-Based Early Exit, Mixed-Precision Predication and Fine-Grained Power Management., , , , , , , , , und 4 andere Autor(en). ISSCC, Seite 342-343. IEEE, (2023)