Autor der Publikation

BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective Supervision.

, , , , , , , , , , , und . CVPR, Seite 17830-17839. IEEE, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective Supervision., , , , , , , , , und 2 andere Autor(en). CVPR, Seite 17830-17839. IEEE, (2023)Masked AutoDecoder is Effective Multi-Task Vision Generalist., , , , , und . CoRR, (2024)OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text., , , , , , , , , und 30 andere Autor(en). CoRR, (2024)Scene as Occupancy., , , , , , , , , und 1 andere Autor(en). CoRR, (2023)InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks., , , , , , , , , und 5 andere Autor(en). CoRR, (2023)Weakly Supervised Monocular 3D Detection with a Single-View Image., , , , und . CoRR, (2024)InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions., , , , , , , , , und 2 andere Autor(en). CVPR, Seite 14408-14419. IEEE, (2023)Learning 1D Causal Visual Representation with De-focus Attention Networks., , , , , , , , , und 1 andere Autor(en). CoRR, (2024)How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites., , , , , , , , , und 25 andere Autor(en). CoRR, (2024)Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like Architectures., , , , , , , , , und . CoRR, (2024)