h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Performance modeling and prediction for dense linear algebra = Performance-Modellierung und -Vorhersage für Dichtbesetzte Lineare Algebra



Verantwortlichkeitsangabevorgelegt von Elmar Peise, Master of Science

ImpressumAachen 2017

Umfang1 Online-Ressource (xii, 257 Seiten) : Illustrationen


Dissertation, RWTH Aachen University, 2017

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University 2018


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
; ;

Tag der mündlichen Prüfung/Habilitation
2017-11-30

Online
DOI: 10.18154/RWTH-2018-223017
URL: http://publications.rwth-aachen.de/record/721186/files/721186.pdf

Einrichtungen

  1. Aachen Institute for Advanced Study in Computational Engineering Science (AICES) (080003)
  2. Lehr- und Forschungsgebiet für Algorithmen-Orientierte Code-Generierung für Hochleistungsrechnerarchitekturen (123620)
  3. Fachgruppe Informatik (120000)

Projekte

  1. GSC 111:  Aachen Institute for Advanced Study in Computational Engineering Science (AICES) (24613455) (24613455)

Inhaltliche Beschreibung (Schlagwörter)
dense linear algebra (frei) ; performance modeling (frei) ; performance prediction (frei)

Thematische Einordnung (Klassifikation)
DDC: 004

Kurzfassung
Diese Dissertation stellt messungsbasierte Techniken zur Performancemodellierung und -Vorhersage für Algorithmen der dichtbesetzten linearen Algebra vor. Als ein Kernprinzip vermeiden diese Techniken die Ausführung solcher Algorithmen völlig und sagen ihre Performance stattdessen durch Laufzeitschätzungen ihrer Kernoperationen vorher. Für eine Vielzahl an Operationen erlauben diese Vorhersagen schnell die effizienteste Algorithmuskonfigurationen aus verfügbaren Alternativen zu wählen. Wir betrachten zwei Szenarien, die ein breites Spektrum von Berechnungen abdecken: Um die Performance von geblockten Algorithmen vorherzusagen, entwerfen wir algorithmenunabhängige Performancemodelle für Kernoperationen, die pro Plattform einmalig automatisiert generiert werden. Für diverse Matrixoperationen identifizieren auf solchen Modellen basierende Vorhersagen schnell und treffsicher den schnellsten Algorithmus und eine nahezu optimale Blockgröße. Für Performancevorhersagen von BLAS-basierten Tensorkontraktionen schlagen wir Microbenchmarks vor, die Caching-Effekte einkalkulieren und die hochreguläre Struktur der Kontraktionen ausnutzen. In nur einem Bruchteil der Laufzeit einer Kontraktion identifizieren auf solchen Microbenchmarks basierende Vorhersagen die schnellste Kombination aus Tensortraversierung und Kernoperation.

This dissertation introduces measurement-based performance modeling and prediction techniques for dense linear algebra algorithms. As a core principle, these techniques avoid executions of such algorithms entirely, and instead predict their performance through runtime estimates for the underlying compute kernels. For a variety of operations, these predictions allow to quickly select the fastest algorithm configurations from available alternatives. We consider two scenarios that cover a wide range of computations: To predict the performance of blocked algorithms, we design algorithm-independent performance models for kernel operations that are generated automatically once per platform. For various matrix operations, instantaneous predictions based on such models both accurately identify the fastest algorithm, and select a near-optimal block size. For performance predictions of BLAS-based tensor contractions, we propose cache-aware micro-benchmarks that take advantage of the highly regular structure inherent to contraction algorithms. At merely a fraction of a contraction's runtime, predictions based on such micro-benchmarks identify the fastest combination of tensor traversal and compute kernel.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis

Format
online

Sprache
English

Externe Identnummern
HBZ: HT019650566

Interne Identnummern
RWTH-2018-223017
Datensatz-ID: 721186

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Central and Other Institutions
Public records
Publications database
120000
080003
123620

 Record created 2018-03-19, last modified 2023-04-08


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)