Autor der Publikation

Billion-Scale Pretraining with Vision Transformers for Multi-Task Visual Representations.

, , , , und . WACV, Seite 1431-1440. IEEE, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Toward Transformer-Based Object Detection., , , , , und . CoRR, (2020)Robust Change Captioning., , und . ICCV, Seite 4623-4632. IEEE, (2019)Vision and Language Understanding Through Generative Modeling. University of California, Berkeley, USA, (2023)Billion-Scale Pretraining with Vision Transformers for Multi-Task Visual Representations., , , , und . WACV, Seite 1431-1440. IEEE, (2022)Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding., , , , , und . EMNLP, Seite 457-468. The Association for Computational Linguistics, (2016)Discovering Non-monotonic Autoregressive Orderings with Variational Inference., , , , , , und . ICLR, OpenReview.net, (2021)Learning a Unified Embedding for Visual Search at Pinterest., , , , und . KDD, Seite 2412-2420. ACM, (2019)More Control for Free! Image Synthesis with Semantic Diffusion Guidance., , , , , , , , und . WACV, Seite 289-299. IEEE, (2023)Benchmark for Compositional Text-to-Image Synthesis., , , , und . NeurIPS Datasets and Benchmarks, (2021)Shape-Guided Diffusion with Inside-Outside Attention., , , , , , , und . WACV, Seite 4186-4195. IEEE, (2024)