Methoden und Werkzeuge zur automatischen Kontrolle der Thread-Platzierung auf Mehrkernprozessoren
Seiten
2011
|
1., Aufl.
Shaker (Verlag)
978-3-8440-0177-8 (ISBN)
Shaker (Verlag)
978-3-8440-0177-8 (ISBN)
- Keine Verlagsinformationen verfügbar
- Artikel merken
Die Taktfrequenz von Mikroprozessoren wurde noch vor wenigen Jahren mit jeder neuen Prozessorgeneration kontinuierlich erhöht. Aufgrund von physikalischen Rahmenbedingungen wie Energiebedarf oder Wärmeabgabe konnte diese Entwicklung nicht beliebig weiterverfolgt werden. Um weiterhin Leistungssteigerungen zu gewährleisten, werden derzeit mehrere vollständige Prozessorkerne in einen Chip integriert. Um die volle Leistungsfähigkeit dieser Mehrkernprozessoren optimal auszunutzen, müssen die darauf ablaufenden Programme parallelisiert werden. Da die Parallelisierung von Programmen bzw. deren Optimierung fehleranfällig und zeitaufwendig ist, benötigen Entwickler Konzepte und Werkzeuge, die sie dabei unterstützen.
Diese Arbeit befasst sich mit dem Thema der Platzierung von Threads auf Mehrkernrechnern mit gemeinsamem Speicher. Die Architektur aktueller Mehrkernprozessoren wird ebenso vorgestellt und klassifiziert wie gängige Methoden der Leistungsbewertung von Rechnersystemen und Programmen. Auf dieser Basis werden Konzepte erarbeitet, um die optimale Thread-zu-Kern-Platzierung (Kernbindung) für ein zu untersuchendes Programm hinsichtlich eines gegebenen Optimierungsziels (z.B. kürzeste Programmlaufzeit oder niedrigster Energieverbrauch) zu ermitteln. Dabei finden die Besonderheiten von Mehrkernprozessoren wie gemeinsame Cache-Speicher oder schnelle Verbindungsnetzwerke auf dem Chip Berücksichtigung.
Die wesentlichen Erkenntnisse der erarbeiteten Konzepte werden in einem prototypischen Werkzeug umgesetzt, das zur Programmlaufzeit verschiedene Kernbindungen untersucht und bewertet. Anhand der Anwendungsprogramme aus dem SPEC-OMP-Benchmark wird gezeigt, dass das entwickelte Werkzeug einen Anwender in die Lage versetzt, die optimale Kernbindung für seine Problemstellung auf den verschiedenen Klassen von Mehrkernrechnern zuverlässig zu ermitteln. Der zeitliche Mehraufwand, der durch die Verwendung des Werkzeugs entsteht, wird untersucht und ausführlich dargestellt.
Exemplarisch wird nachgewiesen, dass auch bei parallelen Programmen, die auf Nachrichtenaustausch basieren, eine optimale Prozessplatzierung signifikante Leistungssteigerungen mit sich bringen kann. Abschließend wird anhand einer parallelen Anwendung aus dem Bereich der Nuklearmedizin der Einfluss verschiedener Kernbindungen auf die elektrische Leistungsaufnahme untersucht. Es wird aufgezeigt, dass für die eingesetzte Architektur unterschiedliche Kernbindungen zu stark variierender Energieaufnahme führen.
Diese Arbeit befasst sich mit dem Thema der Platzierung von Threads auf Mehrkernrechnern mit gemeinsamem Speicher. Die Architektur aktueller Mehrkernprozessoren wird ebenso vorgestellt und klassifiziert wie gängige Methoden der Leistungsbewertung von Rechnersystemen und Programmen. Auf dieser Basis werden Konzepte erarbeitet, um die optimale Thread-zu-Kern-Platzierung (Kernbindung) für ein zu untersuchendes Programm hinsichtlich eines gegebenen Optimierungsziels (z.B. kürzeste Programmlaufzeit oder niedrigster Energieverbrauch) zu ermitteln. Dabei finden die Besonderheiten von Mehrkernprozessoren wie gemeinsame Cache-Speicher oder schnelle Verbindungsnetzwerke auf dem Chip Berücksichtigung.
Die wesentlichen Erkenntnisse der erarbeiteten Konzepte werden in einem prototypischen Werkzeug umgesetzt, das zur Programmlaufzeit verschiedene Kernbindungen untersucht und bewertet. Anhand der Anwendungsprogramme aus dem SPEC-OMP-Benchmark wird gezeigt, dass das entwickelte Werkzeug einen Anwender in die Lage versetzt, die optimale Kernbindung für seine Problemstellung auf den verschiedenen Klassen von Mehrkernrechnern zuverlässig zu ermitteln. Der zeitliche Mehraufwand, der durch die Verwendung des Werkzeugs entsteht, wird untersucht und ausführlich dargestellt.
Exemplarisch wird nachgewiesen, dass auch bei parallelen Programmen, die auf Nachrichtenaustausch basieren, eine optimale Prozessplatzierung signifikante Leistungssteigerungen mit sich bringen kann. Abschließend wird anhand einer parallelen Anwendung aus dem Bereich der Nuklearmedizin der Einfluss verschiedener Kernbindungen auf die elektrische Leistungsaufnahme untersucht. Es wird aufgezeigt, dass für die eingesetzte Architektur unterschiedliche Kernbindungen zu stark variierender Energieaufnahme führen.
| Reihe/Serie | Research Report Series Lehrstuhl für Rechnertechnik und Rechnerorganisation Technische Universität München ; 35 |
|---|---|
| Sprache | deutsch |
| Maße | 148 x 210 mm |
| Gewicht | 264 g |
| Einbandart | Paperback |
| Themenwelt | Mathematik / Informatik ► Informatik ► Theorie / Studium |
| Schlagworte | automatische Performance-Analyse • CMP • Mehrkernprozessoren • Pinning • Thread-Platzierung |
| ISBN-10 | 3-8440-0177-8 / 3844001778 |
| ISBN-13 | 978-3-8440-0177-8 / 9783844001778 |
| Zustand | Neuware |
| Informationen gemäß Produktsicherheitsverordnung (GPSR) | |
| Haben Sie eine Frage zum Produkt? |
Mehr entdecken
aus dem Bereich
aus dem Bereich
Grundlagen – Anwendungen – Perspektiven
Buch | Softcover (2022)
Springer Vieweg (Verlag)
CHF 53,15
was jeder über Informatik wissen sollte
Buch | Softcover (2024)
Springer Vieweg (Verlag)
CHF 53,15
Teil 2 der gestreckten Abschlussprüfung Fachinformatiker/-in …
Buch | Softcover (2025)
Europa-Lehrmittel (Verlag)
CHF 37,90