Autor der Publikation

Singing-Tacotron: Global Duration Control Attention and Dynamic Filter for End-to-end Singing Voice Synthesis.

, , , , und . DDAM@MM, Seite 53-59. ACM, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

System Fingerprints Detection for DeepFake Audio: An Initial Dataset and Investigation., , , , , , und . CoRR, (2022)UnifySpeech: A Unified Framework for Zero-shot Text-to-Speech and Voice Conversion., , , , , und . CoRR, (2023)Spatial and spectral deep attention fusion for multi-channel speech separation using deep embedding features., , , , und . CoRR, (2020)Fewer-token Neural Speech Codec with Time-invariant Codes., , , , , , und . CoRR, (2023)ADD 2022: the first Audio Deep Synthesis Detection Challenge., , , , , , , , , und 7 andere Autor(en). ICASSP, Seite 9216-9220. IEEE, (2022)Context-Aware Mask Prediction Network for End-to-End Text-Based Speech Editing., , , , , und . ICASSP, Seite 6082-6086. IEEE, (2022)A Robust Deep Audio Splicing Detection Method via Singularity Detection Feature., , , , , , , und . ICASSP, Seite 2919-2923. IEEE, (2022)ADD 2023: the Second Audio Deepfake Detection Challenge., , , , , , , , , und 8 andere Autor(en). DADA@IJCAI, Volume 3597 von CEUR Workshop Proceedings, Seite 125-130. CEUR-WS.org, (2023)Learn Spelling from Teachers: Transferring Knowledge from Language Models to Sequence-to-Sequence Speech Recognition., , , , und . INTERSPEECH, Seite 3795-3799. ISCA, (2019)Dynamic Soft Windowing and Language Dependent Style Token for Code-Switching End-to-End Speech Synthesis., , , , , und . INTERSPEECH, Seite 2937-2941. ISCA, (2020)