Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers.

Z. Yao, R. Aminabadi, S. Youn, X. Wu, E. Zheng, und Y. He. CoRR, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Enayatollah Yazdani

Ibrahim Yazdani

Shams Yazdani

Fahema Yazdani

Sima Yazdani

Weitere Publikationen von Autoren mit dem selben Namen

SHARP: An Adaptable, Energy-Efficient Accelerator for Recurrent Neural Networks.R. Aminabadi, O. Ruwase, M. Zhang, Y. He, J. Arnau, und A. González. ACM Trans. Embed. Comput. Syst., 22 (2): 30:1-30:23 (März 2023)Understanding INT4 Quantization for Transformer Models: Latency Speedup, Composability, and Failure Cases.X. Wu, C. Li, R. Aminabadi, Z. Yao, und Y. He. CoRR, (2023)Using DeepSpeed and Megatron to Train Megatron-Turing NLG 530B, A Large-Scale Generative Language Model.S. Smith, M. Patwary, B. Norick, P. LeGresley, S. Rajbhandari, J. Casper, Z. Liu, S. Prabhumoye, G. Zerveas, V. Korthikanti und 10 andere Autor(en). CoRR, (2022)ZeroQuant: Efficient and Affordable Post-Training Quantization for Large-Scale Transformers.Z. Yao, R. Aminabadi, M. Zhang, X. Wu, C. Li, und Y. He. NeurIPS, (2022)ZeroQuant(4+2): Redefining LLMs Quantization with a New FP6-Centric Strategy for Diverse Generative Tasks.X. Wu, H. Xia, S. Youn, Z. Zheng, S. Chen, A. Bakhtiari, M. Wyatt, R. Aminabadi, Y. He, O. Ruwase und 2 andere Autor(en). CoRR, (2023)ZeRO-Offload: Democratizing Billion-Scale Model Training.J. Ren, S. Rajbhandari, R. Aminabadi, O. Ruwase, S. Yang, M. Zhang, D. Li, und Y. He. USENIX Annual Technical Conference, Seite 551-564. USENIX Association, (2021)Understanding Int4 Quantization for Language Models: Latency Speedup, Composability, and Failure Cases.X. Wu, C. Li, R. Aminabadi, Z. Yao, und Y. He. ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 37524-37539. PMLR, (2023)DeepSpeed-FastGen: High-throughput Text Generation for LLMs via MII and DeepSpeed-Inference.C. Holmes, M. Tanaka, M. Wyatt, A. Awan, J. Rasley, S. Rajbhandari, R. Aminabadi, H. Qin, A. Bakhtiari, L. Kurilenko und 1 andere Autor(en). CoRR, (2024)ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers.Z. Yao, R. Aminabadi, S. Youn, X. Wu, E. Zheng, und Y. He. CoRR, (2023)DeepSpeed- Inference: Enabling Efficient Inference of Transformer Models at Unprecedented Scale.R. Aminabadi, S. Rajbhandari, A. Awan, C. Li, D. Li, E. Zheng, O. Ruwase, S. Smith, M. Zhang, J. Rasley und 1 andere Autor(en). SC, Seite 46:1-46:15. IEEE, (2022)

BibSonomy

Disambiguierung von "Aminabadi, Reza Yazdani"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Enayatollah Yazdani

Ibrahim Yazdani

Shams Yazdani

Fahema Yazdani

Sima Yazdani

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Aminabadi, Reza Yazdani"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Enayatollah Yazdani

Ibrahim Yazdani

Shams Yazdani

Fahema Yazdani

Sima Yazdani

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers.