Autor der Publikation

Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-Modal Structured Representations.

, , , , , , , , , , und . AAAI, Seite 2417-2425. AAAI Press, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Learning Max-Margin GeoSocial Multimedia Network Representations for Point-of-Interest Suggestion., , , , , , und . SIGIR, Seite 833-836. ACM, (2017)Video Dialog via Multi-Grained Convolutional Self-Attention Context Networks., , , , , und . SIGIR, Seite 465-474. ACM, (2019)Saliency based proposal refinement in robotic vision., , und . RCAR, Seite 85-90. IEEE, (2017)Video Question Answering via Knowledge-based Progressive Spatial-Temporal Attention Network., , , , , und . TOMM, 15 (2s): 52:1-52:22 (2019)Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering., , und . CoRR, (2022)Unsupervised Discovery of Interpretable Directions in h-space of Pre-trained Diffusion Models., , , , und . CoRR, (2023)User Preference Learning for Online Social Recommendation., , , , und . IEEE Trans. Knowl. Data Eng., 28 (9): 2522-2534 (2016)Cross-modal Prompts: Adapting Large Pre-trained Models for Audio-Visual Downstream Tasks., , , , , und . CoRR, (2023)TaoHighlight: Commodity-Aware Multi-Modal Video Highlight Detection in E-Commerce., , , , , und . IEEE Trans. Multim., (2022)Two-Order Deep Learning for Generalized Synthesis of Radiation Patterns for Antenna Arrays., , , , , und . IEEE Trans. Artif. Intell., 4 (5): 1359-1368 (Oktober 2023)