Autor der Publikation

RSTNet: Captioning With Adaptive Attention on Visual and Non-Visual Words.

, , , , , , , und . CVPR, Seite 15465-15474. Computer Vision Foundation / IEEE, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Towards Local Visual Modeling for Image Captioning., , , , und . CoRR, (2023)Towards End-to-end Semi-supervised Learning for One-stage Object Detection., , , , und . CoRR, (2023)TRAR: Routing the Attention Spans in Transformer for Visual Question Answering., , , , , , , und . ICCV, Seite 2054-2064. IEEE, (2021)Free VQA Models from Knowledge Inertia by Pairwise Inconformity Learning., , , , und . AAAI, Seite 9316-9323. AAAI Press, (2019)Deep Instruction Tuning for Segment Anything Model., , , , , , und . CoRR, (2024)PixelFolder: An Efficient Progressive Pixel Synthesis Network for Image Generation., , , , , , und . CoRR, (2022)Not All Attention is Needed: Parameter and Computation Efficient Transfer Learning for Multi-modal Large Language Models., , , , und . CoRR, (2024)Parameter and Computation Efficient Transfer Learning for Vision-Language Pre-trained Models., , , , , und . NeurIPS, (2023)More Than An Answer: Neural Pivot Network for Visual Qestion Answering., , , , und . ACM Multimedia, Seite 681-689. ACM, (2017)Towards Cross-modality Topic Modelling via Deep Topical Correlation Analysis., , , , , und . ICASSP, Seite 4115-4119. IEEE, (2019)