Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Spoken Moments: Learning Joint Audio-Visual Representations From Video Descriptions.

M. Monfort, S. Jin, A. Liu, D. Harwath, R. Feris, J. Glass, und A. Oliva. CVPR, Seite 14871-14881. Computer Vision Foundation / IEEE, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Hua Jing

Li Jin

Hong Jin

Xiufang Jin

Depu Jin

Weitere Publikationen von Autoren mit dem selben Namen

LangNav: Language as a Perceptual Representation for Navigation.B. Pan, R. Panda, S. Jin, R. Feris, A. Oliva, P. Isola, und Y. Kim. CoRR, (2023)Automatic adaptation of object detectors to new domains using self-training.A. RoyChowdhury, P. Chakrabarty, A. Singh, S. Jin, H. Jiang, L. Cao, und E. Learned-Miller. CVPR Workshops, Seite 22-32. Computer Vision Foundation / IEEE, (2019)FT2TF: First-Person Statement Text-To-Talking Face Generation.X. Diao, M. Cheng, W. Barrios, und S. Jin. CoRR, (2023)How Transferable are Video Representations Based on Synthetic Data?Y. whan Kim, S. Mishra, S. Jin, R. Panda, H. Kuehne, L. Karlinsky, V. Saligrama, K. Saenko, A. Oliva, und R. Feris. NeurIPS, (2022)Leveraging Temporal Context in Low Representational Power Regimes.C. Fosco, S. Jin, E. Josephs, und A. Oliva. CVPR, Seite 10693-10703. IEEE, (2023)Unsupervised Hard Example Mining from Videos for Improved Object Detection.S. Jin, A. RoyChowdhury, H. Jiang, A. Singh, A. Prasad, D. Chakraborty, und E. Learned-Miller. ECCV (13), Volume 11217 von Lecture Notes in Computer Science, Seite 316-333. Springer, (2018)Learning Human Action Recognition Representations Without Real Humans.H. Zhong, S. Mishra, D. Kim, S. Jin, R. Panda, H. Kuehne, L. Karlinsky, V. Saligrama, A. Oliva, und R. Feris. CoRR, (2023)Cross-Modal Discrete Representation Learning.A. Liu, S. Jin, C. Lai, A. Rouditchenko, A. Oliva, und J. Glass. CoRR, (2021)Cross-Modal Discrete Representation Learning.A. Liu, S. Jin, C. Lai, A. Rouditchenko, A. Oliva, und J. Glass. ACL (1), Seite 3013-3035. Association for Computational Linguistics, (2022)Half&Half: New Tasks and Benchmarks for Studying Visual Common Sense.A. Singh, H. Su, S. Jin, H. Jiang, C. Manjesh, G. Luo, Z. He, L. Hong, E. Learned-Miller, und R. Cowell. CVPR Workshops, Seite 1-4. Computer Vision Foundation / IEEE, (2019)

BibSonomy

Disambiguierung von "Jin, SouYoung"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Spoken Moments: Learning Joint Audio-Visual Representations From Video Descriptions.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Hua Jing

Li Jin

Hong Jin

Xiufang Jin

Depu Jin

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Jin, SouYoung"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Spoken Moments: Learning Joint Audio-Visual Representations From Video Descriptions.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Hua Jing

Li Jin

Hong Jin

Xiufang Jin

Depu Jin

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Spoken Moments: Learning Joint Audio-Visual Representations From Video Descriptions.