Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Mesh-tensorflow: Deep learning for supercomputers, , , , , , , , , und 1 andere Autor(en). Advances in Neural Information Processing Systems, Seite 10435--10444. (2018)Adafactor: Adaptive Learning Rates with Sublinear Memory Cost., und . ICML, Volume 80 von Proceedings of Machine Learning Research, Seite 4603-4611. PMLR, (2018)GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding., , , , , , , , und . CoRR, (2020)GSPMD: General and Scalable Parallelization for ML Computation Graphs., , , , , , , , , und 6 andere Autor(en). CoRR, (2021)Sparse Non-negative Matrix Language Modeling., , und . Trans. Assoc. Comput. Linguistics, (2016)Fast Transformer Decoding: One Write-Head is All You Need. (2019)cite arxiv:1911.02150.Skip-gram Language Modeling Using Sparse Non-negative Matrix Probability Estimation., , und . CoRR, (2014)Sparse non-negative matrix language modeling for geo-annotated query session data., und . ASRU, Seite 8-14. IEEE, (2015)Music Transformer, , , , , , , , , und . (2018)cite arxiv:1809.04281Comment: Improved skewing section and accompanying figures. Previous titles are Än Improved Relative Self-Attention Mechanism for Transformer with Application to Music Generation" and "Music Transformer".Talking-Heads Attention., , , , und . CoRR, (2020)