Autor der Publikation

On-device audio-visual multi-person wake word spotting.

, , , , und . CAAI Trans. Intell. Technol., 8 (4): 1578-1589 (Dezember 2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

DepthGAN: GAN-based Depth Generation of Indoor Scenes from Semantic Layouts., , , und . CoRR, (2022)Deep Metric Learning-Assisted 3D Audio-Visual Speaker Tracking via Two-Layer Particle Filter., , , , und . Complex., (2020)Audio-Visual Fusion Network Based on Conformer for Multimodal Emotion Recognition., , , und . CICAI (2), Volume 13605 von Lecture Notes in Computer Science, Seite 315-326. Springer, (2022)Self-Supervised 3D Skeleton Representation Learning with Active Sampling and Adaptive Relabeling for Action Recognition., , , , , und . ICIP, Seite 56-60. IEEE, (2023)3D Audio-Visual Speaker Tracking with A Two-Layer Particle Filter., , und . ICIP, Seite 1955-1959. IEEE, (2019)MVSSC: Meta-reinforcement learning based visual indoor navigation using multi-view semantic spatial context., , , und . Pattern Recognit. Lett., (Januar 2024)Audio-visual keyword transformer for unconstrained sentence-level keyword spotting., , , , , und . CAAI Trans. Intell. Technol., 9 (1): 142-152 (Februar 2024)Cascade RDN: Towards Accurate Localization in Industrial Visual Anomaly Detection With Structural Anomaly Generation., , , und . IEEE Robotics Autom. Lett., 8 (9): 5560-5567 (September 2023)Joint Adversarial and Collaborative Learning for Self-Supervised Action Recognition., , , , , , und . CoRR, (2023)Multi-Modal Perception Attention Network with Self-Supervised Learning for Audio-Visual Speaker Tracking., , und . AAAI, Seite 1456-1463. AAAI Press, (2022)