Autor der Publikation

DEMix Layers: Disentangling Domains for Modular Language Modeling.

, , , , und . NAACL-HLT, Seite 5557-5576. Association for Computational Linguistics, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Constant-Time Machine Translation with Conditional Masked Language Models., , , und . CoRR, (2019)Reliable, Adaptable, and Attributable Language Models with Retrieval., , , , , , und . CoRR, (2024)Detecting Pretraining Data from Large Language Models., , , , , , , und . CoRR, (2023)Generalization through Memorization: Nearest Neighbor Language Models., , , , und . ICLR, OpenReview.net, (2020)Efficient Large Scale Language Modeling with Mixtures of Experts, , , , , , , , , und 14 andere Autor(en). (2021)cite arxiv:2112.10684Comment: EMNLP 2022.QLoRA: Efficient Finetuning of Quantized LLMs, , , und . (2023)cite arxiv:2305.14314Comment: Extended NeurIPS submission.The case for 4-bit precision: k-bit Inference Scaling Laws, und . (2022)cite arxiv:2212.09720.Cloze-driven Pretraining of Self-attention Networks., , , , und . EMNLP/IJCNLP (1), Seite 5359-5368. Association for Computational Linguistics, (2019)A Discrete Hard EM Approach for Weakly Supervised Question Answering., , , und . EMNLP/IJCNLP (1), Seite 2851-2864. Association for Computational Linguistics, (2019)Span-based Hierarchical Semantic Parsing for Task-Oriented Dialog., , , , , und . EMNLP/IJCNLP (1), Seite 1520-1526. Association for Computational Linguistics, (2019)