Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image.

S. Goto, K. Onishi, Y. Saito, K. Tachibana, und K. Mori. INTERSPEECH, Seite 1321-1325. ISCA, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Kentaro Harada

Kentaro Kusumi

Kentaro Azuma

Kentaro Zens

Kentaro Suetsugu

Weitere Publikationen von Autoren mit dem selben Namen

Joint Adversarial Training of Speech Recognition and Synthesis Models for Many-to-One Voice Conversion Using Phonetic Posteriorgrams.Y. Saito, K. Akuzawa, und K. Tachibana. IEICE Trans. Inf. Syst., 103-D (9): 1978-1987 (2020)ChatGPT-EDSS: Empathetic Dialogue Speech Synthesis Trained from ChatGPT-derived Context Word Embeddings.Y. Saito, S. Takamichi, E. Iimori, K. Tachibana, und H. Saruwatari. INTERSPEECH, Seite 3048-3052. ISCA, (2023)Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment.T. Igarashi, Y. Saito, K. Seki, S. Takamichi, R. Yamamoto, K. Tachibana, und H. Saruwatari. CoRR, (2024)LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning.M. Kawamura, R. Yamamoto, Y. Shirahata, T. Hasumi, und K. Tachibana. CoRR, (2024)Efficient Blind Source Separation Combining Closed-Form Second-Order ICA and Nonclosed-Form Higher-Order ICA.K. Tachibana, H. Saruwatari, Y. Mori, S. Miyabe, K. Shikano, und A. Tanaka. ICASSP (1), Seite 45-48. IEEE, (2007)Period VITS: Variational Inference with Explicit Pitch Modeling for End-To-End Emotional Speech Synthesis.Y. Shirahata, R. Yamamoto, E. Song, R. Terashima, J. Kim, und K. Tachibana. ICASSP, Seite 1-5. IEEE, (2023)Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image.S. Goto, K. Onishi, Y. Saito, K. Tachibana, und K. Mori. INTERSPEECH, Seite 1321-1325. ISCA, (2020)DRSpeech: Degradation-Robust Text-to-Speech Synthesis with Frame-Level and Utterance-Level Acoustic Representation Learning.T. Saeki, K. Tachibana, und R. Yamamoto. INTERSPEECH, Seite 793-797. ISCA, (2022)A Unified Accent Estimation Method Based on Multi-Task Learning for Japanese Text-to-Speech.B. Park, R. Yamamoto, und K. Tachibana. INTERSPEECH, Seite 1931-1935. ISCA, (2022)An Investigation of Noise Shaping with Perceptual Weighting for Wavenet-Based Speech Generation.K. Tachibana, T. Toda, Y. Shiga, und H. Kawai. ICASSP, Seite 5664-5668. IEEE, (2018)

BibSonomy

Disambiguierung von "Tachibana, Kentaro"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Kentaro Harada

Kentaro Kusumi

Kentaro Azuma

Kentaro Zens

Kentaro Suetsugu

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Tachibana, Kentaro"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Kentaro Harada

Kentaro Kusumi

Kentaro Azuma

Kentaro Zens

Kentaro Suetsugu

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Face2Speech: Towards Multi-Speaker Text-to-Speech Synthesis Using an Embedding Vector Predicted from a Face Image.