Autor der Publikation

GEB+: A Benchmark for Generic Event Boundary Captioning, Grounding and Retrieval.

, , , , , und . ECCV (35), Volume 13695 von Lecture Notes in Computer Science, Seite 709-725. Springer, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Scenes-Objects-Actions: A Multi-task, Multi-label Video Dataset., , , , , , und . ECCV (14), Volume 11218 von Lecture Notes in Computer Science, Seite 660-676. Springer, (2018)Self-Supervised Object Detection from Egocentric Videos., , , , , , , und . ICCV, Seite 5202-5214. IEEE, (2023)What Makes Training Multi-Modal Networks Hard?, , und . CoRR, (2019)EgoTracks: A Long-term Egocentric Visual Object Tracking Dataset., , , , und . CoRR, (2023)MINOTAUR: Multi-task Video Grounding From Multimodal Queries., , , , , , , und . CoRR, (2023)PyTorchVideo: A Deep Learning Library for Video Understanding., , , , , , , , , und 6 andere Autor(en). ACM Multimedia, Seite 3783-3786. ACM, (2021)Generic Event Boundary Detection: A Benchmark for Event Segmentation., , , , und . ICCV, Seite 8055-8064. IEEE, (2021)Shape representation via conformal mapping., und . Computational Imaging, Volume 6498 von SPIE Proceedings, Seite 64980G. SPIE, (2007)What Makes Training Multi-Modal Classification Networks Hard?, , und . CVPR, Seite 12692-12702. Computer Vision Foundation / IEEE, (2020)FP-NAS: Fast Probabilistic Neural Architecture Search., , , , , und . CVPR, Seite 15139-15148. Computer Vision Foundation / IEEE, (2021)