Artikel in einem Konferenzbericht,

Segmental SpeechCLIP: Utilizing Pretrained Image-text Models for Audio-Visual Learning.

, , , , und .
INTERSPEECH, Seite 431-435. ISCA, (2023)

Metadaten

Tags

Nutzer

  • @dblp

Kommentare und Rezensionen