Autor der Publikation

A Performance Optimization Framework for Compilation of Tensor Contraction Expressions into Parallel Programs.

, , , , , , , und . IPDPS, IEEE Computer Society, (2002)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Affine transformations for communication minimal parallelization and locality optimization of arbitrarily nested loop sequences, , , , , und . OSU-CISRC-5/07-TR43. The Ohio State University, (Mai 2007)Multifrontal Factorization of Sparse Matrices on Shared-Memory Multiprocessors., , und . ICPP (3), Seite 159-166. CRC Press, (1991)Memory-optimal evaluation of expression trees involving large objects., , , , und . Comput. Lang. Syst. Struct., 37 (2): 63-75 (2011)Optimal Algorithms for All-to-All Personalized Communication on Rings and Two Dimensional Tori., , und . J. Parallel Distributed Comput., 43 (1): 3-13 (1997)Empirical performance model-driven data layout optimization and library call selection for tensor contraction expressions., , , , , und . J. Parallel Distributed Comput., 72 (3): 338-352 (2012)Efficient synthesis of out-of-core algorithms using a nonlinear optimization solver., , , , , , und . J. Parallel Distributed Comput., 66 (5): 659-673 (2006)Cluster partitioning approaches to mapping parallel programs onto a hypercube., , und . Parallel Comput., 13 (1): 1-16 (1990)A Tiling Perspective for Register Optimization., , , und . CoRR, (2014)Integrating parallel file systems with object-based storage devices., , , , und . SC, Seite 27. ACM Press, (2007)One-to-one mapping of process graphs onto a hypercube., und . ICS, Seite 91-98. ACM, (1989)