Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

ALADIN: Distilling Fine-grained Alignment Scores for Efficient Image-Text Matching and Retrieval., , , , , , und . CBMI, Seite 64-70. ACM, (2022)OpenFashionCLIP: Vision-and-Language Contrastive Learning with Open-Source Fashion Data., , , , , und . ICIAP (1), Volume 14233 von Lecture Notes in Computer Science, Seite 245-256. Springer, (2023)Transform, Warp, and Dress: A New Transformation-guided Model for Virtual Try-on., , , , und . ACM Trans. Multim. Comput. Commun. Appl., 18 (2): 62:1-62:24 (2022)A unified cycle-consistent neural model for text and image retrieval., , , und . Multim. Tools Appl., 79 (35-36): 25697-25721 (2020)Fashion-Oriented Image Captioning with External Knowledge Retrieval and Fully Attentive Gates., , , , , und . Sensors, 23 (3): 1286 (Februar 2023)Visual saliency for image captioning in new multimedia services., , , und . ICME Workshops, Seite 309-314. IEEE Computer Society, (2017)Multi-level Net: A Visual Saliency Prediction Model., , , und . ECCV Workshops (2), Volume 9914 von Lecture Notes in Computer Science, Seite 302-315. (2016)Multimodal-Conditioned Latent Diffusion Models for Fashion Image Editing., , , , und . CoRR, (2024)Wiki-LLaVA: Hierarchical Retrieval-Augmented Generation for Multimodal LLMs., , , , , , und . CoRR, (2024)The Revolution of Multimodal Large Language Models: A Survey., , , , , , , und . ACL (Findings), Seite 13590-13618. Association for Computational Linguistics, (2024)