Autor der Publikation

Spatially Aware Multimodal Transformers for TextVQA.

, , , , , , und . ECCV (9), Volume 12354 von Lecture Notes in Computer Science, Seite 715-732. Springer, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

GridToPix: Training Embodied Agents with Minimal Supervision., , , , , und . ICCV, Seite 15121-15131. IEEE, (2021)RGB-Only Reconstruction of Tabletop Scenes for Collision-Free Manipulator Control., , , , , , , , und . ICRA, Seite 1778-1785. IEEE, (2023)Occupancy Planes for Single-view RGB-D Human Reconstruction., , , und . CoRR, (2022)Fully Connected Deep Structured Networks., und . CoRR, (2015)Learning to Play in a Day: Faster Deep Reinforcement Learning by Optimality Tightening., , , und . ICLR (Poster), OpenReview.net, (2017)Fast, Diverse and Accurate Image Captioning Guided by Part-Of-Speech., , , , und . CVPR, Seite 10695-10704. Computer Vision Foundation / IEEE, (2019)Can We Learn Heuristics for Graphical Model Inference Using Reinforcement Learning?, , und . CVPR, Seite 7586-7596. Computer Vision Foundation / IEEE, (2020)Convolutional Image Captioning., , und . CVPR, Seite 5561-5570. Computer Vision Foundation / IEEE Computer Society, (2018)Message Passing Inference for Large Scale Graphical Models with High Order Potentials., , und . NIPS, Seite 1134-1142. (2014)Pipe-SGD: A Decentralized Pipelined SGD Framework for Distributed Deep Net Training., , , , , und . NeurIPS, Seite 8056-8067. (2018)