Autor der Publikation

YFACC: A Yorùbá Speech-Image Dataset for Cross-Lingual Keyword Localisation Through Visual Grounding.

, , und . SLT, Seite 731-738. IEEE, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

AXES at TRECVID 2012: KIS, INS, and MED., , , , , , , , , und 9 andere Autor(en). TRECVID, National Institute of Standards and Technology (NIST), (2012)The SpeeD-ZevoTech submission at DISPLACE 2023., , , und . INTERSPEECH, Seite 3572-3576. ISCA, (2023)YFACC: A Yorùbá Speech-Image Dataset for Cross-Lingual Keyword Localisation Through Visual Grounding., , und . SLT, Seite 731-738. IEEE, (2022)The INRIA-LIM-VocR and AXES submissions to TrecVid 2014 Multimedia Event Detection., , , , , , , , , und 3 andere Autor(en). TRECVID, National Institute of Standards and Technology (NIST), (2014)Data-Filtering Methods for Self-Training of Automatic Speech Recognition Systems., , , , und . SLT, Seite 141-147. IEEE, (2021)Revisiting SincNet: An Evaluation of Feature and Network Hyperparameters for Speaker Recognition., , , , und . EUSIPCO, Seite 1-5. IEEE, (2020)Speaker disentanglement in video-to-speech conversion., , und . EUSIPCO, Seite 46-50. IEEE, (2021)Robust and efficient models for action recognition and localization. (Modèles robustes et efficaces pour la reconnaissance d'action et leur localisation).. Grenoble Alpes University, France, (2015)Improving Multimodal Speech Recognition by Data Augmentation and Speech Representations., und . CVPR Workshops, Seite 4578-4587. IEEE, (2022)Kite: Automatic Speech Recognition for Unmanned Aerial Vehicles., und . INTERSPEECH, Seite 2998-3002. ISCA, (2019)