Autor der Publikation

Unsupervised and Pseudo-Supervised Vision-Language Alignment in Visual Dialog.

, , , , , und . ACM Multimedia, Seite 4142-4153. ACM, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Image Segmentation Technology Based on Genetic Algorithm., , , , , und . ICDSP, Seite 27-31. ACM, (2019)Nonlinear Analytical Model of Linear Switched Reluctance Motor With Segmented Secondary Considering Iron Saturation and End Effect., , , , und . IEEE Access, (2023)VLP: A Survey on Vision-language Pre-training., , , , , , und . Int. J. Autom. Comput., 20 (1): 38-56 (2023)Efficient and Model-Based Infrared and Visible Image Fusion via Algorithm Unrolling., , , , , und . IEEE Trans. Circuits Syst. Video Technol., 32 (3): 1186-1196 (2022)Gating recurrent mixture density networks for acoustic modeling in statistical parametric speech synthesis., , und . ICASSP, Seite 5520-5524. IEEE, (2016)Pretreatment of sEMG Using Wavelet Threshold Method., , , , , und . ICMLC, Seite 638-643. IEEE, (2018)A Dual Modal Presentation of Network Relationships in Texts., , , und . AMCIS, Seite 383. Association for Information Systems, (2005)Design Touch Feedback for Blind Users., und . HCI (28), Volume 373 von Communications in Computer and Information Science, Seite 281-285. Springer, (2013)Improved linear discriminant analysis based on two-dimensional Gabor for palmprint recognition., , und . SoCPaR, Seite 157-160. IEEE, (2011)Listen, Understand and Translate: Triple Supervision Decouples End-to-end Speech-to-text Translation., , , , , , und . AAAI, Seite 12749-12759. AAAI Press, (2021)