Autor der Publikation

MUGEN: A Playground for Video-Audio-Text Multimodal Understanding and GENeration.

, , , , , , , , und . ECCV (8), Volume 13668 von Lecture Notes in Computer Science, Seite 431-449. Springer, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Hyperbolic Contrastive Learning for Visual Representations beyond Objects., , , , und . CVPR, Seite 6840-6849. IEEE, (2023)Robust Contrastive Learning Using Negative Samples with Diminished Semantics., , , , und . NeurIPS, Seite 27356-27368. (2021)Creative Sketch Generation., , , und . ICLR, OpenReview.net, (2021)Coherent Zero-Shot Visual Instruction Generation., , und . CoRR, (2024)From Text to Sound: A Preliminary Study on Retrieving Sound Effects to Radio Stories., , , , , und . SIGIR, Seite 865-868. ACM, (2019)Hallucinating Point Cloud into 3D Sculptural Object., , , , , , und . CoRR, (2018)Expressive Text-to-Image Generation with Rich Text., , , und . ICCV, Seite 7511-7522. IEEE, (2023)Creative Sketch Generation., , , und . CoRR, (2020)Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer., , , , , , , und . ECCV (17), Volume 13677 von Lecture Notes in Computer Science, Seite 102-118. Springer, (2022)MUGEN: A Playground for Video-Audio-Text Multimodal Understanding and GENeration., , , , , , , , und . ECCV (8), Volume 13668 von Lecture Notes in Computer Science, Seite 431-449. Springer, (2022)