Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers.

Z. Qiu, Z. Huang, Y. Huang, und J. Fu. Tiny Papers @ ICLR, OpenReview.net, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Xiuhui Qiu

Xueping Qiu

Tiequn Qiu

Wei Qiu

Renzhi Qiu

Weitere Publikationen von Autoren mit dem selben Namen

Detection of Advertising Users Based on K-SMOTE and Ensemble Learning.Z. Qiu, Z. Zhou, Y. Long, C. Ji, J. Li, und Y. Tang. HCC, Volume 13795 von Lecture Notes in Computer Science, Seite 133-145. Springer, (2021)Academic Article Classification Algorithm Based on Pre-trained Model and Keyword Extraction.Z. Zhou, D. Zheng, Z. Qiu, R. Lin, Z. Wu, und C. Yuan. ChineseCSCW (2), Volume 1492 von Communications in Computer and Information Science, Seite 149-161. Springer, (2021)A Survey on Multilingual Large Language Models: Corpora, Alignment, and Bias.Y. Xu, L. Hu, J. Zhao, Z. Qiu, Y. Ye, und H. Gu. CoRR, (2024)Unlocking Emergent Modularity in Large Language Models.Z. Qiu, Z. Huang, und J. Fu. NAACL-HLT, Seite 2638-2660. Association for Computational Linguistics, (2024)Emergent Mixture-of-Experts: Can Dense Pre-trained Transformers Benefit from Emergent Modular Structures?Z. Qiu, Z. Huang, und J. Fu. CoRR, (2023)Supported Policy Optimization for Offline Reinforcement Learning.J. Wu, H. Wu, Z. Qiu, J. Wang, und M. Long. NeurIPS, (2022)A University Portrait System Incorporating Academic Social Network.Y. Lai, L. Lan, R. Liang, L. Huang, Z. Qiu, und Y. Tang. ChineseCSCW (2), Volume 1492 von Communications in Computer and Information Science, Seite 25-36. Springer, (2021)Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers.Z. Qiu, Z. Huang, Y. Huang, und J. Fu. Tiny Papers @ ICLR, OpenReview.net, (2024)HyperMoE: Towards Better Mixture of Experts via Transferring Among Experts.H. Zhao, Z. Qiu, H. Wu, Z. Wang, Z. He, und J. Fu. ACL (1), Seite 10605-10618. Association for Computational Linguistics, (2024)Stacking Your Transformers: A Closer Look at Model Growth for Efficient LLM Pre-Training.W. Du, T. Luo, Z. Qiu, Z. Huang, Y. Shen, R. Cheng, Y. Guo, und J. Fu. CoRR, (2024)

BibSonomy

Disambiguierung von "Qiu, Zihan"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Xiuhui Qiu

Xueping Qiu

Tiequn Qiu

Wei Qiu

Renzhi Qiu

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Qiu, Zihan"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Xiuhui Qiu

Xueping Qiu

Tiequn Qiu

Wei Qiu

Renzhi Qiu

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Empirical Study on Updating Key-Value Memories in Transformer Feed-forward Layers.