Autor der Publikation

UniFine: A Unified and Fine-grained Approach for Zero-shot Vision-Language Understanding.

, , , , , und . ACL (Findings), Seite 778-793. Association for Computational Linguistics, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Compressed-domain techniques for image/video indexing and manipulation.. ICIP, Seite 314-317. IEEE Computer Society, (1995)Local color and texture extraction and spatial query., und . ICIP (3), Seite 1011-1014. IEEE Computer Society, (1996)Multimodal Clustering Networks for Self-supervised Learning from Unlabeled Videos., , , , , , , , , und 3 andere Autor(en). ICCV, Seite 7992-8001. IEEE, (2021)Generative, discriminative, and ensemble learning on multi-modal perceptual fusion toward news video story segmentation., und . ICME, Seite 1091-1094. IEEE Computer Society, (2004)A utility framework for the automatic generation of audio-visual skims., , und . ACM Multimedia, Seite 189-198. ACM, (2002)General and domain-specific techniques for detecting and recognizing superimposed text in video., , und . ICIP (1), Seite 593-596. IEEE, (2002)Region Feature Based Similarity Searching of Semantic Video Objects., und . ICIP (2), Seite 111-115. IEEE, (1999)A model for image splicing., und . ICIP, Seite 1169-1172. IEEE, (2004)PANEL: Challenges for Multimedia/Multimodal Research in the Next Decade., , , , , , , und . ACM Multimedia, Seite 2234-2235. ACM, (2019)A survey of multimodal sentiment analysis., , , , , und . Image Vis. Comput., (2017)