Autor der Publikation

Adversarial Inference for Multi-Sentence Video Description.

, , , und . CVPR, Seite 6598-6608. Computer Vision Foundation / IEEE, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Efficient Lifelong Learning with A-GEM., , , und . ICLR (Poster), OpenReview.net, (2019)High-Level Fusion of Depth and Intensity for Pedestrian Classification., , und . DAGM-Symposium, Volume 5748 von Lecture Notes in Computer Science, Seite 101-110. Springer, (2009)Improving Selective Visual Question Answering by Learning from Your Peers., , , , , , , und . CVPR, Seite 24049-24059. IEEE, (2023)FLAVA: A Foundational Language And Vision Alignment Model., , , , , , und . CVPR, Seite 15617-15629. IEEE, (2022)Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding., , , , , und . EMNLP, Seite 457-468. The Association for Computational Linguistics, (2016)Reliable Visual Question Answering: Abstain Rather Than Answer Incorrectly., , , , , , und . ECCV (36), Volume 13696 von Lecture Notes in Computer Science, Seite 148-166. Springer, (2022)The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval., , , und . CoRR, (2024)Modeling Relationships in Referential Expressions with Compositional Modular Networks., , , , und . CVPR, Seite 4418-4427. IEEE Computer Society, (2017)Graph-Based Global Reasoning Networks., , , , , und . CoRR, (2018)TextCaps: A Dataset for Image Captioning with Reading Comprehension., , , und . ECCV (2), Volume 12347 von Lecture Notes in Computer Science, Seite 742-758. Springer, (2020)