Autor der Publikation

Low-Order Finite Element Solver with Small Matrix-Matrix Multiplication Accelerated by AI-Specific Hardware for Crustal Deformation Computation.

, , , , , , , , , und . PASC, Seite 16:1-16:11. ACM, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

GPU Implementation of a Sophisticated Implicit Low-Order Finite Element Solver with FP21-32-64 Computation Using OpenACC., , , , , und . WACCPD@SC, Volume 12017 von Lecture Notes in Computer Science, Seite 3-24. Springer, (2019)Large-Scale Distributed Second-Order Optimization Using Kronecker-Factored Approximate Curvature for Deep Convolutional Neural Networks., , , , , und . CVPR, Seite 12359-12367. Computer Vision Foundation / IEEE, (2019)A Fast Scalable Implicit Solver with Concentrated Computation for Nonlinear Time-Evolution Problems on Low-Order Unstructured Finite Elements., , , , , , , , , und 2 andere Autor(en). IPDPS, Seite 620-629. IEEE Computer Society, (2018)CAGRA: Highly Parallel Graph Construction and Approximate Nearest Neighbor Search for GPUs., , , , , und . ICDE, Seite 4236-4247. IEEE, (2024)Scalable and Practical Natural Gradient for Large-Scale Deep Learning., , , , , und . CoRR, (2020)Performance Optimizations and Analysis of Distributed Deep Learning with Approximated Second-Order Optimization Method., , , , , und . ICPP Workshops, Seite 21:1-21:8. ACM, (2019)Interference-aware Incoming Message Detection for MPI Threaded Progression., , und . CCGRID, Seite 184-185. IEEE Computer Society, (2013)Speeding Up Kernel Scheduler by Reducing Cache Misses., , , , , und . USENIX ATC, FREENIX Track, Seite 275-285. USENIX, (2002)Parallel Top-K Algorithms on GPU: A Comprehensive Study and New Methods., , , und . SC, Seite 76:1-76:13. ACM, (2023)Preliminary Performance Evaluation of Grace-Hopper GH200., , , , , , , , , und 4 andere Autor(en). CLUSTER Workshops, Seite 184-185. IEEE, (2024)