Artikel,

InternEvo: Efficient Long-sequence Large Language Model Training via Hybrid Parallelism and Redundant Sharding.

Q. Chen, D. Gu, G. Wang, X. Chen, Y. Xiong, T. Huang, Q. Hu, X. Jin, Y. Wen, T. Zhang, und P. Sun.
CoRR, (2024)

Metadaten

BibTeX-Schlüssel: journals/corr/abs-2401-09149
Eintragstyp: article
Jahr: 2024
Zeitschrift: CoRR
Band: abs/2401.09149
ee: https://doi.org/10.48550/arXiv.2401.09149
URL: http://dblp.uni-trier.de/db/journals/corr/corr2401.html#abs-2401-09149

Tags

dblp

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Bitte melden Sie sich an um selbst Rezensionen oder Kommentare zu erstellen.

Zitieren Sie diese Publikation

Suchen auf