From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Word Discovery in Visually Grounded, Self-Supervised Speech Models.

P. Peng, и D. Harwath. INTERSPEECH, стр. 2823-2827. ISCA, (2022)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Wahyudi David

Florian Bodo David

Jens-Ulrich Davids

Joachim David

Heinz David

Другие публикации лиц с тем же именем

Jointly Discovering Visual Objects and Spoken Words from Raw Sensory Input.D. Harwath, A. Recasens, D. Surís, G. Chuang, A. Torralba, и J. Glass. ECCV (6), том 11210 из Lecture Notes in Computer Science, стр. 659-677. Springer, (2018)Adversarial Input Ablation for Audio-Visual Learning.D. Xu, и D. Harwath. ICASSP, стр. 7742-7746. IEEE, (2022)Fast-Slow Transformer for Visually Grounding Speech.P. Peng, и D. Harwath. ICASSP, стр. 7727-7731. IEEE, (2022)Unsupervised Fine-Tuning Data Selection for ASR Using Self-Supervised Speech Models.R. Gody, и D. Harwath. ICASSP, стр. 1-5. IEEE, (2023)Learning Words by Drawing Images.D. Suris, A. Recasens, D. Bau, D. Harwath, J. Glass, и A. Torralba. CVPR, стр. 2029-2038. Computer Vision Foundation / IEEE, (2019)A summary of the 2012 JHU CLSP workshop on zero resource speech technologies and models of early language acquisition.A. Jansen, E. Dupoux, S. Goldwater, M. Johnson, S. Khudanpur, K. Church, N. Feldman, H. Hermansky, F. Metze, R. Rose и 17 other автор(ы). ICASSP, стр. 8111-8115. IEEE, (2013)Word Discovery in Visually Grounded, Self-Supervised Speech Models.P. Peng, и D. Harwath. INTERSPEECH, стр. 2823-2827. ISCA, (2022)MAE-AST: Masked Autoencoding Audio Spectrogram Transformer.A. Baade, P. Peng, и D. Harwath. INTERSPEECH, стр. 2438-2442. ISCA, (2022)SpeechCLIP+: Self-Supervised Multi-Task Representation Learning for Speech Via Clip and Speech-Image Data.H. Wang, Y. Shih, H. Chang, L. Berry, P. Peng, H. Lee, H. Wang, и D. Harwath. ICASSP Workshops, стр. 465-469. IEEE, (2024)Learning to Map Efficiently by Active Echolocation.X. Hu, S. Purushwalkam, D. Harwath, и K. Grauman. IROS, стр. 1505-1510. (2023)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter