

# Auf einen Blick

|                                                                       |            |
|-----------------------------------------------------------------------|------------|
| <b>Über den Autor</b> .....                                           | <b>7</b>   |
| <b>Einleitung</b> .....                                               | <b>19</b>  |
| <b>Teil I: Grundlegendes zu Rechnerarchitekturen</b> .....            | <b>25</b>  |
| <b>Kapitel 1:</b> Blick aus der Vogelperspektive. ....                | 27         |
| <b>Kapitel 2:</b> Leistungsbewertung von Rechnern. ....               | 55         |
| <b>Teil II: Das Kernelement: Der Prozessor</b> .....                  | <b>71</b>  |
| <b>Kapitel 3:</b> Die von Neumann-Maschine .....                      | 73         |
| <b>Kapitel 4:</b> Programmiermodell und Assemblerprogrammierung ..... | 139        |
| <b>Kapitel 5:</b> Kommunikation und Ausnahmeverarbeitung .....        | 193        |
| <b>Teil III: Das Konzept der Speicherhierarchie</b> .....             | <b>253</b> |
| <b>Kapitel 6:</b> Speichersysteme im Rechner .....                    | 255        |
| <b>Kapitel 7:</b> Cachespeicher .....                                 | 295        |
| <b>Kapitel 8:</b> Virtuelle Speicherverwaltung .....                  | 337        |
| <b>Teil IV: Vom Nutzen der Parallelverarbeitung</b> .....             | <b>373</b> |
| <b>Kapitel 9:</b> Die Idee der Parallelisierung .....                 | 375        |
| <b>Kapitel 10:</b> Fließbandverarbeitung .....                        | 409        |
| <b>Kapitel 11:</b> Parallele Pipelines und Superskalarität .....      | 441        |
| <b>Kapitel 12:</b> Vom Prozessor zu Rechnersystemen .....             | 479        |
| <b>Kapitel 13:</b> Die zukünftige Entwicklung .....                   | 491        |
| <b>Teil V: Der Top-Ten-Teil</b> .....                                 | <b>507</b> |
| <b>Kapitel 14:</b> Zehn Kernthemen zur Rechnerarchitektur .....       | 509        |
| <b>Kapitel 15:</b> Mögliche Trugschlüsse .....                        | 519        |
| <b>Kapitel 16:</b> Zehn Selbsttests zum Fachgebiet .....              | 527        |
| <b>Wichtige Literatur</b> .....                                       | <b>535</b> |
| <b>Abbildungsverzeichnis</b> .....                                    | <b>537</b> |
| <b>Stichwortverzeichnis</b> .....                                     | <b>545</b> |

# Inhaltsverzeichnis

|                                                               |           |
|---------------------------------------------------------------|-----------|
| <b>Über den Autor .....</b>                                   | <b>7</b>  |
| <b>Einleitung .....</b>                                       | <b>19</b> |
| Über dieses Buch.....                                         | 20        |
| Törichte Annahmen über den Leser.....                         | 21        |
| Was Sie nicht lesen müssen.....                               | 22        |
| Wie dieses Buch aufgebaut ist.....                            | 22        |
| Teil I: Grundlegendes zu Rechnerarchitekturen .....           | 22        |
| Teil II: Das Kernelement: Der Prozessor .....                 | 22        |
| Teil III: Das Konzept der Speicherhierarchie .....            | 23        |
| Teil IV: Vom Nutzen der Parallelverarbeitung .....            | 23        |
| Teil V: Der Top-Ten-Teil .....                                | 23        |
| Symbole, die in diesem Buch verwendet werden.....             | 23        |
| Wie es weitergeht .....                                       | 24        |
| <b>TEIL I</b>                                                 |           |
| <b>GRUNDLEGENDES ZU RECHNERARCHITEKTUREN .....</b>            | <b>25</b> |
| <b>Kapitel 1</b>                                              |           |
| <b>Blick aus der Vogelperspektive .....</b>                   | <b>27</b> |
| Das Zeitalter der Computer .....                              | 27        |
| Embedded Systems und Ubiquitous Computing .....               | 28        |
| Klassen von Rechnern .....                                    | 30        |
| Der Begriff »Rechnerarchitektur« .....                        | 33        |
| Die Instruction Set Architecture (ISA) .....                  | 34        |
| Die Mikro-Architekturebene .....                              | 38        |
| Die Definition der Rechnerarchitektur aus meiner Sicht .....  | 38        |
| Höchstintegration und die Grenzen des Wachstums .....         | 39        |
| Steigerung der Anzahl der Transistoren auf einem Chip .....   | 39        |
| Der Performance-Gap .....                                     | 42        |
| Alternativen zur Steigerung der Taktrate .....                | 44        |
| Fortschritte beim automatisierten Entwurf solcher Chips ..... | 45        |
| Modellierungstechnik .....                                    | 47        |
| Aufbaupläne (Instanzennetze) .....                            | 48        |
| Ablaufpläne (Petri-Netze) .....                               | 51        |
| <b>Kapitel 2</b>                                              |           |
| <b>Leistungsbewertung von Rechnern .....</b>                  | <b>55</b> |
| Überblick über Leistungsmaße .....                            | 56        |
| MIPS und MFLOPS .....                                         | 57        |
| Die Prozessorausführungszeit .....                            | 58        |
| Vereinfachung durch den CPI-Wert .....                        | 61        |
| Benchmarkprogramme .....                                      | 63        |
| Das Gesetz von Amdahl .....                                   | 67        |

|                                                                    |            |
|--------------------------------------------------------------------|------------|
| <b>TEIL II</b>                                                     |            |
| <b>DAS KERNELEMENT: DER PROZESSOR .....</b>                        | <b>71</b>  |
| <b>Kapitel 3</b>                                                   |            |
| <b>Die von Neumann-Maschine .....</b>                              | <b>73</b>  |
| Die Komponenten eines von Neumann-Rechners .....                   | 76         |
| Der Prozessor .....                                                | 76         |
| Die Ein-/Ausgabeeinheit .....                                      | 77         |
| Der Hauptspeicher .....                                            | 78         |
| Der Systembus .....                                                | 79         |
| Charakteristika der von Neumann-Maschine .....                     | 80         |
| Interpretation der Informationskomponenten .....                   | 80         |
| Befehlszählerprinzip und die Abwicklung eines Programms .....      | 84         |
| Prozesse und Strukturelemente in einem Rechner .....               | 87         |
| Komponenten des Operationswerks .....                              | 94         |
| Speicherorganisation .....                                         | 104        |
| Klassen von Prozessorarchitekturen .....                           | 118        |
| Das Steuerwerk .....                                               | 124        |
| <b>Kapitel 4</b>                                                   |            |
| <b>Programmiermodell und Assemblerprogrammierung .....</b>         | <b>139</b> |
| Charakteristische Merkmale der Hochsprachen-Programmierung .....   | 140        |
| Charakteristische Merkmale der maschinennahen Programmierung ..... | 140        |
| Das Programmiermodell .....                                        | 141        |
| Assemblerprogrammierung .....                                      | 143        |
| Der Befehlssatz des Prozessors .....                               | 144        |
| Addressierungsarten .....                                          | 150        |
| Assemblerprogrammierung am Beispiel .....                          | 158        |
| Ablauf der Assemblierung .....                                     | 166        |
| Unterprogrammtechnik .....                                         | 179        |
| <b>Kapitel 5</b>                                                   |            |
| <b>Kommunikation und Ausnahmeverarbeitung .....</b>                | <b>193</b> |
| Datenaustausch über den Systembus .....                            | 193        |
| Zeitverhalten am Systembus .....                                   | 194        |
| Synchroner Bus .....                                               | 194        |
| Semi-synchroner Systembus .....                                    | 197        |
| Asynchroner Systembus .....                                        | 198        |
| Bussysteme in der heutigen Praxis .....                            | 202        |
| Bus-Arbitration .....                                              | 203        |
| Lokale Bus-Arbitration .....                                       | 203        |
| Globale Bus-Arbitration .....                                      | 206        |
| Priorisierung mehrerer Master .....                                | 207        |
| Zentrales Verfahren zur Busvergabe .....                           | 207        |
| Dezentrales Verfahren zur Busvergabe .....                         | 208        |
| Erweiterung des Prozessormodells .....                             | 209        |
| Ausnahmeverarbeitung .....                                         | 210        |
| Einführung des Abwicklerverwalters .....                           | 211        |

|                                                                          |            |
|--------------------------------------------------------------------------|------------|
| Klassifizierung von Unterbrechungen und Ausnahmeverarbeitungen . . . . . | 213        |
| Priorisierung in einer Interruptebene. . . . .                           | 222        |
| Modellierung des Hardware-Dispatchers. . . . .                           | 228        |
| Ein-/Ausgabe-Interfaces und Synchronisation . . . . .                    | 234        |
| Ein-/Ausgabe-Interfaces . . . . .                                        | 234        |
| Informationelle Struktur eines Interface-Bausteins . . . . .             | 235        |
| Synchronisation mit peripheren Instanzen . . . . .                       | 236        |
| Synchronisation durch Busy-Waiting . . . . .                             | 238        |
| Synchronisation durch Programmunterbrechung . . . . .                    | 241        |
| Synchronisation durch Handshake-Betrieb . . . . .                        | 241        |
| Direkter Speicherzugriff DMA (Direct Memory Access) . . . . .            | 243        |
| Der DMA-Controller . . . . .                                             | 246        |
| Aufbau eines DMA-Controllers. . . . .                                    | 247        |
| Das Kommunikations-Interface PCI-Express . . . . .                       | 251        |
| <b>TEIL III</b><br><b>DAS KONZEPT DER SPEICHERHIERARCHIE. . . . .</b>    | <b>253</b> |
| <b>Kapitel 6</b><br><b>Speichersysteme im Rechner . . . . .</b>          | <b>255</b> |
| Der optimale Rechner . . . . .                                           | 255        |
| Die Speicherhierarchie . . . . .                                         | 257        |
| Inhomogenität und Organisation der Speicherhierarchie . . . . .          | 259        |
| Lokalitätseigenschaften von Programmen. . . . .                          | 262        |
| Prinzipieller Aufbau von Halbleiter-Speicherbausteinen. . . . .          | 263        |
| Festwertspeicher . . . . .                                               | 264        |
| Schreib-/Lesespeicher . . . . .                                          | 265        |
| Speicherzugriffe mittels Blockbuszyklen . . . . .                        | 271        |
| Verschränkung von Speicherbänken (Interleaving) . . . . .                | 272        |
| Modularer Speicheraufbau. . . . .                                        | 275        |
| Organisation des Hauptspeichers. . . . .                                 | 276        |
| Praktische Ausprägung des Hauptspeicherzugriffs . . . . .                | 278        |
| Eine Lösung durch spezielle Chipsätze . . . . .                          | 280        |
| Weitere Bausteintypen für Schreib-/Lesespeicher . . . . .                | 283        |
| Sekundärspeicher . . . . .                                               | 285        |
| Festplatten . . . . .                                                    | 286        |
| Redundant Array of Inexpensive Disks (RAID) . . . . .                    | 288        |
| Solid State Disks (SSD) . . . . .                                        | 290        |
| Unternehmensweite Speichersysteme (NAS und SAN) . . . . .                | 290        |
| Archivspeicher . . . . .                                                 | 292        |
| Optische Plattspeicher . . . . .                                         | 292        |
| Magnbandspeicher. . . . .                                                | 293        |
| <b>Kapitel 7</b><br><b>Cachespeicher . . . . .</b>                       | <b>295</b> |
| Das Problem der Zykluszeit . . . . .                                     | 296        |
| Die Idee des Cachings. . . . .                                           | 296        |

## 14 Inhaltsverzeichnis

|                                                                      |     |
|----------------------------------------------------------------------|-----|
| Systemstrukturen für Caches .....                                    | 299 |
| Look-aside-Cache .....                                               | 299 |
| Look-through-Cache .....                                             | 300 |
| Zugriff auf den Cachespeicher .....                                  | 301 |
| Lesezugriffe .....                                                   | 301 |
| Schreibzugriffe .....                                                | 303 |
| Die Idee des Assoziativspeichers .....                               | 306 |
| Verdrängungsstrategie und Alterungsinformation .....                 | 308 |
| Arbeitsweise des Cachespeichers .....                                | 309 |
| Trefferrate und Zugriffszeiten .....                                 | 309 |
| Cache-Kohärenzproblem .....                                          | 310 |
| Kohärenzproblem bei einem Cache-Hit .....                            | 312 |
| Kohärenzproblem bei Copy-back-Verfahren .....                        | 312 |
| Lösung des Kohärenzproblems .....                                    | 313 |
| Strukturen von Cachespeichern .....                                  | 315 |
| Der voll-assoziative Cachespeicher .....                             | 316 |
| Direkt zuordnender Cache (Direct-mapped Cache) .....                 | 319 |
| Mehrwege-Satz-assoziativer Cache (n-way Set-associative Cache) ..... | 322 |
| Das MESI-Protokoll .....                                             | 325 |
| Cachespeicher-Hierarchie .....                                       | 331 |

## Kapitel 8

### Virtuelle Speicherverwaltung .....

## 337

|                                                                      |     |
|----------------------------------------------------------------------|-----|
| Die Idee des virtuellen Speichers .....                              | 337 |
| Das Problem der Speicherzuweisung .....                              | 339 |
| Die Memory Management Unit (MMU) .....                               | 343 |
| Zusammenfassung: Das Prinzip der virtuellen Speicherverwaltung ..... | 344 |
| Segmentverwaltung .....                                              | 346 |
| Das Seitenverfahren .....                                            | 356 |
| Die zweistufige Adressumsetzung .....                                | 365 |
| Virtuelle und reale Cache-Adressierung .....                         | 368 |
| Virtuelle Cache-Adressierung .....                                   | 368 |
| Reale Cache-Adressierung .....                                       | 370 |

## TEIL IV

### VOM NUTZEN DER PARALLELVERARBEITUNG .....

## 373

## Kapitel 9

### Die Idee der Parallelisierung .....

## 375

|                                                                    |     |
|--------------------------------------------------------------------|-----|
| Der Einfluss der Parallelisierung auf die Rechnerarchitektur ..... | 376 |
| Charakteristika für eine Parallelisierung auf Hardwareebene .....  | 377 |
| Mikroskopische oder makroskopische Parallelität .....              | 378 |
| Symmetrische oder asymmetrische Strukturen .....                   | 379 |
| Feinkörnige oder grobkörnige Parallelität .....                    | 380 |
| Implizite oder explizite Parallelität .....                        | 381 |

|                                                                            |            |
|----------------------------------------------------------------------------|------------|
| Typen paralleler Architekturen – die Taxonomie von Flynn .....             | 381        |
| Single Instruction Single Data (SISD) .....                                | 383        |
| Single Instruction Multiple Data (SIMD) .....                              | 383        |
| Multiple Instruction Single Data (MISD) .....                              | 384        |
| Multiple Instruction Multiple Data (MIMD) .....                            | 384        |
| Performance von Multiprozessorsystemen und von Multicore-Prozessoren ..... | 386        |
| Die Harvard-Architektur .....                                              | 389        |
| CISC-Rechner und deren Probleme .....                                      | 389        |
| Die Idee der RISC-Maschinen .....                                          | 390        |
| Die Architektur eines RISC-Prozessors .....                                | 391        |
| Erweiterung der ALU um einen Bypass .....                                  | 395        |
| Zusammenfassung .....                                                      | 397        |
| Synchronisation von Prozessen .....                                        | 398        |
| Sequenzielle und parallele Prozesse .....                                  | 398        |
| Gegenseitiger Ausschluss von Prozessen .....                               | 400        |
| Binäre Semaphore zur Synchronisation .....                                 | 402        |
| Der Test-and-Set-Befehl für Semaphorvariablen .....                        | 404        |
| <b>Kapitel 10</b><br><b>Fließbandverarbeitung</b> .....                    | <b>409</b> |
| Die DLX-Pipeline .....                                                     | 412        |
| Leistungssteigerung durch Pipelining .....                                 | 415        |
| Hardwarestruktur einer k-stufigen Pipeline .....                           | 419        |
| Pipeline-Hemmnisse .....                                                   | 422        |
| Datenabhängigkeiten .....                                                  | 423        |
| Lösung der Datenkonflikte .....                                            | 429        |
| Strukturkonflikte .....                                                    | 433        |
| Lösungen von Strukturkonflikten .....                                      | 434        |
| Steuerflusskonflikte .....                                                 | 435        |
| <b>Kapitel 11</b><br><b>Parallele Pipelines und Superskalarität</b> .....  | <b>441</b> |
| Parallelisierung der Programmabwicklung .....                              | 441        |
| Pipelines mit mehreren Ausführungseinheiten .....                          | 442        |
| VLIW-Prozessoren .....                                                     | 446        |
| Superskalare Prozessoren .....                                             | 449        |
| Prinzipielle Architektur einer superskalaren Pipeline .....                | 450        |
| Sprungzielvorhersage .....                                                 | 457        |
| Statische Sprungzielvorhersage .....                                       | 459        |
| Dynamische Sprungzielvorhersage .....                                      | 459        |
| Superskalare Pipeline – eine Verbesserung .....                            | 464        |
| Core-Architektur .....                                                     | 466        |
| Leistungssteigerung durch Multithreading .....                             | 468        |
| Prozesse .....                                                             | 468        |
| Threads .....                                                              | 469        |
| Vorteile des Multithreading .....                                          | 470        |
| Simultaneous Multithreading bei superskalaren Pipelines .....              | 474        |
| Nachteile der auf Performance optimierten Prozessor-Hardware .....         | 475        |

|                                                  |  |            |
|--------------------------------------------------|--|------------|
| <b>Kapitel 12</b>                                |  |            |
| <b>Vom Prozessor zu Rechnersystemen</b>          |  | <b>479</b> |
| Cluster . . . . .                                |  | 480        |
| Supercomputer . . . . .                          |  | 481        |
| Grid Computing . . . . .                         |  | 482        |
| Virtuelle Maschinen. . . . .                     |  | 484        |
| Cloud Computing . . . . .                        |  | 486        |
| Liefermodelle . . . . .                          |  | 487        |
| Dienstleistungsmodelle. . . . .                  |  | 488        |
| <b>Kapitel 13</b>                                |  |            |
| <b>Die zukünftige Entwicklung</b>                |  | <b>491</b> |
| Taktfrequenzen und Miniaturisierung . . . . .    |  | 491        |
| Ein neuer Hoffnungsträger – Graphen . . . . .    |  | 493        |
| Nanotubes als Speichertechnologie . . . . .      |  | 493        |
| Optische Prozessoren. . . . .                    |  | 494        |
| Architektur und Mikroarchitektur . . . . .       |  | 495        |
| Processing-in-Memory . . . . .                   |  | 496        |
| Neuromorphe Hardware . . . . .                   |  | 497        |
| Memristor. . . . .                               |  | 499        |
| Quantencomputer. . . . .                         |  | 500        |
| Qubits und Quantengatter . . . . .               |  | 500        |
| Superposition und Quantenparallelismus . . . . . |  | 501        |
| Quantenverschränkung . . . . .                   |  | 503        |
| Einsatzgebiete für Quantencomputer. . . . .      |  | 505        |
| Ein kurzes Resümee . . . . .                     |  | 506        |
| <b>TEIL V</b>                                    |  |            |
| <b>DER TOP-TEN-TEIL</b>                          |  | <b>507</b> |
| <b>Kapitel 14</b>                                |  |            |
| <b>Zehn Kernthemen zur Rechnerarchitektur</b>    |  | <b>509</b> |
| Höchstintegration für Rechnerchips. . . . .      |  | 509        |
| Die von Neumann-Architektur. . . . .             |  | 510        |
| Die Harvard-Architektur und die RISC-Maschinen   |  | 511        |
| Die Instruction Set Architecture (ISA) . . . . . |  | 511        |
| Die Speicherhierarchie . . . . .                 |  | 512        |
| Cachespeicher . . . . .                          |  | 513        |
| Virtueller Speicher . . . . .                    |  | 514        |
| Fließbandverarbeitung . . . . .                  |  | 514        |
| Superskalare Prozessoren . . . . .               |  | 516        |
| Quantencomputer. . . . .                         |  | 516        |

|                                                                             |            |
|-----------------------------------------------------------------------------|------------|
| <b>Kapitel 15</b>                                                           |            |
| <b>Mögliche Trugschlüsse</b>                                                | <b>519</b> |
| Assemblerprogrammierung ist immer schneller                                 | 519        |
| Die übertragenen Daten pro Zeiteinheit                                      | 520        |
| Lange Pipelines ergeben eine bessere Performance                            | 520        |
| Höhere Cache-Kapazität ergibt bessere Performance                           | 521        |
| Von Neumann-Architektur als Auslaufmodell                                   | 522        |
| Multi-Prozessorsysteme sind stets performanter<br>als Mono-Prozessorsysteme | 522        |
| Amdahls Gesetz bei parallelen Rechnern                                      | 523        |
| Flash-Speicher statt Hauptspeicher                                          | 523        |
| Multicore-Prozessoren in der Taxonomie von Flynn                            | 524        |
| Hoher Parallelitätsgrad<br>bei Anwendungssoftware                           | 524        |
| <b>Kapitel 16</b>                                                           |            |
| <b>Zehn Selbsttests zum Fachgebiet</b>                                      | <b>527</b> |
| Selbsttest zu Kapitel 1                                                     | 527        |
| Selbsttest zu Kapitel 2 und 3                                               | 528        |
| Selbsttest zu Kapitel 4                                                     | 529        |
| Selbsttest zu Kapitel 4 und 5                                               | 529        |
| Selbsttest zu Kapitel 3 und 6                                               | 530        |
| Selbsttest zu Kapitel 9 und 10                                              | 531        |
| Selbsttest zu Kapitel 10 und 11                                             | 531        |
| Selbsttest zu Kapitel 7 und 11                                              | 532        |
| Selbsttest zu Kapitel 8                                                     | 533        |
| Selbsttest zu Kapitel 13                                                    | 533        |
| Lösungen zu den Selbsttests                                                 | 534        |
| <b>Wichtige Literatur</b>                                                   | <b>535</b> |
| <b>Abbildungsverzeichnis</b>                                                | <b>537</b> |
| <b>Stichwortverzeichnis</b>                                                 | <b>545</b> |