,

Learning Audio-Video Modalities from Image Captions.

, , , , , , и .
ECCV (14), том 13674 из Lecture Notes in Computer Science, стр. 407-426. Springer, (2022)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии