Autor der Publikation

Multimodal Speech Synthesis Architecture for Unsupervised Speaker Adaptation.

, und . INTERSPEECH, Seite 2494-2498. ISCA, (2018)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

NTU-NPU System for Voice Privacy 2024 Challenge., , , , , und . CoRR, (2024)Temporal-Channel Modeling in Multi-head Self-Attention for Synthetic Speech Detection., , , , , und . INTERSPEECH, ISCA, (2024)Deep learning based voice cloning framework for a unified system of text-to-speech and voice conversion.. Graduate University for Advanced Studies, Japan, (2020)Investigating Accuracy of Pitch-accent Annotations in Neural Network-based Speech Synthesis and Denoising Effects., , , und . INTERSPEECH, Seite 37-41. ISCA, (2018)Multimodal Speech Synthesis Architecture for Unsupervised Speaker Adaptation., und . INTERSPEECH, Seite 2494-2498. ISCA, (2018)Latent linguistic embedding for cross-lingual text-to-speech and voice conversion., und . Blizzard Challenge / Voice Conversion Challenge, ISCA, (2020)Room Impulse Responses help attackers to evade Deep Fake Detection., , , und . CoRR, (2024)Scaling and Bias Codes for Modeling Speaker-Adaptive DNN-Based Speech Synthesis Systems., und . SLT, Seite 610-617. IEEE, (2018)A non-expert Kaldi recipe for Vietnamese Speech Recognition System., und . WLSI/OIAF4HLT@COLING, Seite 51-55. The COLING 2016 Organizing Committee, (2016)Controlling Multi-Class Human Vocalization Generation via a Simple Segment-based Labeling Scheme., und . INTERSPEECH, Seite 4379-4383. ISCA, (2023)