Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention

A. Katharopoulos, A. Vyas, N. Pappas, und F. Fleuret. (2020)cite arxiv:2006.16236Comment: ICML 2020, project at https://linear-transformers.com/.

Zusammenfassung

Transformers achieve remarkable performance in several tasks but due to their quadratic complexity, with respect to the input's length, they are prohibitively slow for very long sequences. To address this limitation, we express the self-attention as a linear dot-product of kernel feature maps and make use of the associativity property of matrix products to reduce the complexity from $Ołeft(N^2\right)$ to $Ołeft(N\right)$, where $N$ is the sequence length. We show that this formulation permits an iterative implementation that dramatically accelerates autoregressive transformers and reveals their relationship to recurrent neural networks. Our linear transformers achieve similar performance to vanilla transformers and they are up to 4000x faster on autoregressive prediction of very long sequences.

Beschreibung

Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention

Links und Ressourcen

BibTeX-Schlüssel: katharopoulos2020transformers
Eintragstyp: misc
Jahr: 2020
URL: http://arxiv.org/abs/2006.16236
Hinweis: cite arxiv:2006.16236Comment: ICML 2020, project at https://linear-transformers.com/

@wanderinglogics Tags hervorgehoben

Zitieren Sie diese Publikation

Suchen auf

Metadaten

Zuletzt geändert vor einem Jahr
Erstellt vor einem Jahr

Kommentare und Rezensionen
(0)

Es gibt bisher keine Rezension oder Kommentar. Sie können eine schreiben!

BibSonomy

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention

Zusammenfassung

Beschreibung

Links und Ressourcen

Tags

Community

Zitieren Sie diese Publikation

Mehr Zitationsstile

Suchen auf

Metadaten

Kommentare und Rezensionen
(0)

BibSonomy

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention

Zusammenfassung

Beschreibung

Links und Ressourcen

Tags

Community

Zitieren Sie diese Publikation

Mehr Zitationsstile

Suchen auf

Metadaten

Kommentare und Rezensionen (0)

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention

Kommentare und Rezensionen
(0)