Autor der Publikation

A Sound Approach: Using Large Language Models to Generate Audio Descriptions for Egocentric Text-Audio Retrieval.

, , , , und . ICASSP, Seite 7300-7304. IEEE, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

State-of-Art-Reviewing: A Radical Proposal to Improve Scientific Publication., , , und . CoRR, (2020)Self-Supervised Learning of Geometrically Stable Features Through Probabilistic Introspection., , , und . CVPR, Seite 3637-3645. Computer Vision Foundation / IEEE Computer Society, (2018)Cross Modal Retrieval with Querybank Normalisation., , , , und . CVPR, Seite 5184-5195. IEEE, (2022)NamedMask: Distilling Segmenters from Complementary Foundation Models., , und . CVPR Workshops, Seite 4961-4970. IEEE, (2023)Use What You Have: Video retrieval using representations from collaborative experts., , , und . BMVC, Seite 279. BMVA Press, (2019)QUERYD: A Video Dataset with High-Quality Text and Audio Narrations., , , , und . ICASSP, Seite 2265-2269. IEEE, (2021)Semi-convolutional Operators for Instance Segmentation., , , und . ECCV (1), Volume 11205 von Lecture Notes in Computer Science, Seite 89-105. Springer, (2018)Learnable PINs: Cross-modal Embeddings for Person Identity., , und . ECCV (13), Volume 11217 von Lecture Notes in Computer Science, Seite 73-89. Springer, (2018)A Sound Approach: Using Large Language Models to Generate Audio Descriptions for Egocentric Text-Audio Retrieval., , , , und . ICASSP, Seite 7300-7304. IEEE, (2024)InstructVideo: Instructing Video Diffusion Models with Human Feedback., , , , , , , , , und . CVPR, Seite 6463-6474. IEEE, (2024)