From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Learning Audio-Video Modalities from Image Captions.

A. Nagrani, P. Seo, B. Seybold, A. Hauth, S. Manen, C. Sun, и C. Schmid. ECCV (14), том 13674 из Lecture Notes in Computer Science, стр. 407-426. Springer, (2022)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Eunyoung Seo

Ean-Jeong Seo

Paek Pyung Seon

Bong-Seock Seo

Ki-Chang Seong

Другие публикации лиц с тем же именем

Vid2Seq: Large-Scale Pretraining of a Visual Language Model for Dense Video Captioning.A. Yang, A. Nagrani, P. Seo, A. Miech, J. Pont-Tuset, I. Laptev, J. Sivic, и C. Schmid. CVPR, стр. 10714-10726. IEEE, (2023)Look Before You Speak: Visually Contextualized Utterances.P. Seo, A. Nagrani, и C. Schmid. CVPR, стр. 16877-16887. Computer Vision Foundation / IEEE, (2021)Image Question Answering using Convolutional Neural Network with Dynamic Parameter Prediction.H. Noh, P. Seo, и B. Han. CoRR, (2015)MarioQA: Answering Questions by Watching Gameplay Videos.J. Mun, P. Seo, I. Jung, и B. Han. CoRR, (2016)Regularizing Neural Networks via Stochastic Branch Layers.W. Park, P. Seo, B. Han, и M. Cho. ACML, том 101 из Proceedings of Machine Learning Research, стр. 678-693. PMLR, (2019)Learning Correlation Structures for Vision Transformers.M. Kim, P. Seo, C. Schmid, и M. Cho. CoRR, (2024)Reinforcing an Image Caption Generator Using Off-Line Human Feedback.P. Seo, P. Sharma, T. Levinboim, B. Han, и R. Soricut. AAAI, стр. 2693-2700. AAAI Press, (2020)AVFormer: Injecting Vision into Frozen Speech Models for Zero-Shot AV-ASR.P. Seo, A. Nagrani, и C. Schmid. CVPR, стр. 22922-22931. IEEE, (2023)Learning for Single-Shot Confidence Calibration in Deep Neural Networks Through Stochastic Inferences.S. Seo, P. Seo, и B. Han. CVPR, стр. 9030-9038. Computer Vision Foundation / IEEE, (2019)Learning Audio-Video Modalities from Image Captions.A. Nagrani, P. Seo, B. Seybold, A. Hauth, S. Manen, C. Sun, и C. Schmid. ECCV (14), том 13674 из Lecture Notes in Computer Science, стр. 407-426. Springer, (2022)

BibSonomy

Disambiguation

Please choose a person to relate this publication to

Eunyoung Seo

Ean-Jeong Seo

Paek Pyung Seon

Bong-Seock Seo

Ki-Chang Seong

Другие публикации лиц с тем же именем

Disambiguation

BibSonomy

Disambiguation

копироватьудалитьдобавить публикацию в буферЗапись сообществапосмотреть историю данной записиURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Learning Audio-Video Modalities from Image Captions.

Please choose a person to relate this publication to

Eunyoung Seo

Ean-Jeong Seo

Paek Pyung Seon

Bong-Seock Seo

Ki-Chang Seong

Другие публикации лиц с тем же именем

Disambiguation