From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

LLM in a flash: Efficient Large Language Model Inference with Limited Memory.

K. Alizadeh, S. Mirzadeh, D. Belenko, K. Khatamifard, M. Cho, C. del Mundo, M. Rastegari, и M. Farajtabar. CoRR, (2023)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Keivan Pishgah

Khosrow Alizadeh

Alireza Alizadeh

Hüssein Alizadeh

Mansour Alizadeh

Другие публикации лиц с тем же именем

LLM in a flash: Efficient Large Language Model Inference with Limited Memory.K. Alizadeh, S. Mirzadeh, D. Belenko, S. Khatamifard, M. Cho, C. del Mundo, M. Rastegari, и M. Farajtabar. ACL (1), стр. 12562-12584. Association for Computational Linguistics, (2024)ReLU Strikes Back: Exploiting Activation Sparsity in Large Language ModelsI. Mirzadeh, K. Alizadeh, S. Mehta, C. Mundo, O. Tuzel, G. Samei, M. Rastegari, и M. Farajtabar. (2023)ReLU Strikes Back: Exploiting Activation Sparsity in Large Language Models.S. Mirzadeh, K. Alizadeh, S. Mehta, C. del Mundo, O. Tuzel, G. Samei, M. Rastegari, и M. Farajtabar. CoRR, (2023)LLM in a flash: Efficient Large Language Model Inference with Limited Memory.K. Alizadeh, S. Mirzadeh, D. Belenko, K. Khatamifard, M. Cho, C. del Mundo, M. Rastegari, и M. Farajtabar. CoRR, (2023)eDKM: An Efficient and Accurate Train-time Weight Clustering for Large Language Models.M. Cho, K. Alizadeh-Vahid, Q. Fu, S. Adya, C. del Mundo, M. Rastegari, D. Naik, и P. Zatloukal. CoRR, (2023)Butterfly Transform: An Efficient FFT Based Neural Architecture Design.K. Alizadeh-Vahid, A. Prabhu, A. Farhadi, и M. Rastegari. CVPR, стр. 12021-12030. Computer Vision Foundation / IEEE, (2020)DKM: Differentiable k-Means Clustering Layer for Neural Network Compression.M. Cho, K. Alizadeh-Vahid, S. Adya, и M. Rastegari. ICLR, OpenReview.net, (2022)ReLU Strikes Back: Exploiting Activation Sparsity in Large Language Models.S. Mirzadeh, K. Alizadeh-Vahid, S. Mehta, C. del Mundo, O. Tuzel, G. Samei, M. Rastegari, и M. Farajtabar. ICLR, OpenReview.net, (2024)eDKM: An Efficient and Accurate Train-Time Weight Clustering for Large Language Models.M. Cho, K. Alizadeh-Vahid, Q. Fu, S. Adya, C. del Mundo, M. Rastegari, D. Naik, и P. Zatloukal. IEEE Comput. Archit. Lett., 23 (1): 37-40 (января 2024)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter