Autor der Publikation

Vararray Meets T-Sot: Advancing the State of the Art of Streaming Distant Conversational Speech Recognition.

, , , , , und . ICASSP, Seite 1-5. IEEE, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

A two-layer model for behavior and dialogue planning in conversational service robots., , , , , , , , und . IROS, Seite 3329-3335. IEEE, (2005)Multiple index combination for Japanese spoken term detection with optimum index selection based on OOV-region classifier., , und . ICASSP, Seite 8540-8544. IEEE, (2013)Open-vocabulary keyword detection from super-large scale speech database., , , und . MMSP, Seite 939-944. IEEE Signal Processing Society, (2008)Investigation of End-To-End Speaker-Attributed ASR for Continuous Multi-Talker Recordings., , , , , , und . CoRR, (2020)Making Flow-Matching-Based Zero-Shot Text-to-Speech Laugh as You Like., , , , , , , , , und 5 andere Autor(en). CoRR, (2024)Leveraging Timestamp Information for Serialized Joint Streaming Recognition and Translation., , , , , , und . CoRR, (2023)Microsoft Speaker Diarization System for the VoxCeleb Speaker Recognition Challenge 2020., , , , , , , , , und 3 andere Autor(en). CoRR, (2020)Maximum a posteriori Based Decoding for CTC Acoustic Models., , und . INTERSPEECH, Seite 1868-1872. ISCA, (2016)Streaming Multi-Talker ASR with Token-Level Serialized Output Training., , , , , , , , , und . INTERSPEECH, Seite 3774-3778. ISCA, (2022)Streaming Multi-Talker Speech Recognition with Joint Speaker Identification., , , und . Interspeech, Seite 1782-1786. ISCA, (2021)