Autor der Publikation

Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models.

, , , , , und . CoRR, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

No Token Left Behind: Reliable KV Cache Compression via Importance-Aware Mixed Precision Quantization., , , , , , , und . CoRR, (2024)A Low-Power Neural Graphics System for Instant 3D Modeling and Real-Time Rendering on Mobile AR/VR Devices., , , , , , , , , und 1 andere Autor(en). COOL CHIPS, Seite 1-3. IEEE, (2024)Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models., , , , , und . CoRR, (2023)A 709.3 TOPS/W Event-Driven Smart Vision SoC with High-Linearity and Reconfigurable MRAM PIM., , , , , , und . VLSI Technology and Circuits, Seite 1-2. IEEE, (2023)Automatic Network Adaptation for Ultra-Low Uniform-Precision Quantization., , , , , und . CoRR, (2022)A 92 fps and 2.56 mJ/Frame Computing-In-Memory-Based Human Pose Estimation Accelerator With Resource-Efficient Macro for Mobile Devices., , , , und . IEEE Trans. Circuits Syst. II Express Briefs, 71 (6): 2921-2925 (Juni 2024)A 28.6 mJ/iter Stable Diffusion Processor for Text-to-Image Generation with Patch Similarity-based Sparsity Augmentation and Text-based Mixed-Precision., , , , , und . CoRR, (2024)20.7 NeuGPU: A 18.5mJ/Iter Neural-Graphics Processing Unit for Instant-Modeling and Real-Time Rendering with Segmented-Hashing Architecture., , , , , , , , , und . ISSCC, Seite 372-374. IEEE, (2024)