Autor der Publikation

Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image.

, , , , und . INTERSPEECH, Seite 1321-1325. ISCA, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Joint Adversarial Training of Speech Recognition and Synthesis Models for Many-to-One Voice Conversion Using Phonetic Posteriorgrams., , und . IEICE Trans. Inf. Syst., 103-D (9): 1978-1987 (2020)ChatGPT-EDSS: Empathetic Dialogue Speech Synthesis Trained from ChatGPT-derived Context Word Embeddings., , , , und . INTERSPEECH, Seite 3048-3052. ISCA, (2023)Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment., , , , , , und . CoRR, (2024)LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning., , , , und . CoRR, (2024)Efficient Blind Source Separation Combining Closed-Form Second-Order ICA and Nonclosed-Form Higher-Order ICA., , , , , und . ICASSP (1), Seite 45-48. IEEE, (2007)Period VITS: Variational Inference with Explicit Pitch Modeling for End-To-End Emotional Speech Synthesis., , , , , und . ICASSP, Seite 1-5. IEEE, (2023)Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image., , , , und . INTERSPEECH, Seite 1321-1325. ISCA, (2020)DRSpeech: Degradation-Robust Text-to-Speech Synthesis with Frame-Level and Utterance-Level Acoustic Representation Learning., , und . INTERSPEECH, Seite 793-797. ISCA, (2022)A Unified Accent Estimation Method Based on Multi-Task Learning for Japanese Text-to-Speech., , und . INTERSPEECH, Seite 1931-1935. ISCA, (2022)An Investigation of Noise Shaping with Perceptual Weighting for Wavenet-Based Speech Generation., , , und . ICASSP, Seite 5664-5668. IEEE, (2018)