Zum Inhalt springen

AMD Bulldozer

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 15. Juni 2024 um 13:45 Uhr durch imported>Matthäus Wander (link).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Bulldozer ist eine von AMD entwickelte Mikroarchitektur für x86-Prozessoren mit 64-Bit-Erweiterung und Nachfolger von AMD K10. Erste Prozessor-Modelle auf Bulldozer-Basis wurden unter dem Markennamen AMD FX im Oktober 2011 vorgestellt. Das wichtigste Architekturmerkmal ist das sogenannte „Core Multithreading“ (CMT), einige Elemente wurden aber auch aus der AMD-K10-Architektur übernommen.<ref><templatestyles src="Webarchiv/styles.css" />Die Bulldozer-Architektur, Artikel zum offiziellen Start der Prozessoren. (Memento des Vorlage:IconExternal vom 14. Oktober 2011 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/ht4u.net In: ht4u.net</ref> Die Bulldozer-Architektur inklusive der Optimierung Piledriver wurde von der Steamroller-Architektur abgelöst.

Architekturmerkmale

Datei:AMD Bulldozer block diagram (CPU core block).png
Blockdiagramm eines Bulldozer-Moduls

Der komplett neu entwickelte Bulldozer war AMDs größte Mikroarchitekturveränderung seit der Einführung von AMD64 im Jahre 2003. Bulldozer basiert im Unterschied zu AMD K10 auf Modulen. Ein Modul hat zwei 128-Bit-Gleitkommaeinheiten (FPUs), die bei Bedarf zu einer 256-Bit-breiten Gleitkommaeinheit kombiniert werden können. Der FPU stehen pro Modul zwei Integercluster mit je zwei ALUs und zwei AGUs („adress generation units“) zur Seite. Pro Modul gibt es einen von allen Einheiten des Moduls geteilten L2 Cache. Betriebssysteme erkennen ein Modul als zwei logische Prozessorkerne. Ein Bulldozer-Die beherbergt maximal vier Module. Damit können maximal acht Threads gleichzeitig abgearbeitet werden. Der größte Bulldozer-Ableger (Interlagos) setzt sich aus zwei Siliziumplättchen zusammen und kommt mit seinen 16 Threads nicht ganz an den zu der Zeit größten Intel Xeon (Haswell-EP) heran, der mit max. 18 Kernen und Hyper-Threading auf 36 Threads kommt.<ref><templatestyles src="Webarchiv/styles.css" />AMD zeigt Interlagos-Prozessoren mit 16 Kernen (Memento vom 29. August 2014 im Internet Archive), tomshardware.de, 28. Juni 2011</ref><ref><templatestyles src="Webarchiv/styles.css" />AMD Opteron™ Processor Solutions (Memento vom 20. Oktober 2014 im Internet Archive), products.amd.com</ref><ref>Benjamin Benz: Xeon-Prozessor mit 18 Kernen. In: heise online. 20. Juni 2014, abgerufen am 7. Juni 2021.</ref><ref>Intel® Xeon® Processor E5-2699 v3 (45M Cache, 2.30 GHz) Product Specifications. Abgerufen am 7. Juni 2021.</ref>

Modul

Die von AMD bei Bulldozer eingeführte Clustered-Integer-Core-Architektur wurde ursprünglich von DEC entwickelt und erstmals 1996 mit der RISC-CPU Alpha 21264 vorgestellt.

Das Modul ist ein Kompromiss zwischen echtem Dualcore, wo jedem Thread alle Funktionseinheiten des Prozessorkerns zur Verfügung stehen, und einem Singlecore mit Simultaneous Multithreading (SMT). Das Konzept spart Fläche im Vergleich zum gewöhnlichen Dualcore. Ein Modul ist in verschiedene einfach und doppelt vorhandene Einheiten aufgeteilt, die sich zudem manche Ressourcen teilen. Es hat zwei Integer-Einheiten (Ganzzahl) und eine 256-Bit-Floatingpoint-(Gleitkommazahl)-Einheit, die bei Bedarf in zwei 128-Bit-FPUs aufgeteilt werden kann. Die Fetch-und-Decode-Einheit sind ebenfalls nur einfach vorhanden und teilen die Last auf die jeweiligen Einheiten auf. Ein Modul verfügt über einen 2-MB-Shared-L2-Cache, einen 16-kB-4-Wege-L1-Datacache pro Integercluster und einen 64-kB-2-Wege-L1-Instructionscache. Die beiden unabhängigen Integercluster sind jeweils mit zwei ALUs und zwei AGUs ausgestattet, was maximal vier Arithmetik- und Speicheroperationen pro Modul und Takt erlaubt.<ref>Volker Rißka: AMD Bulldozer im Test: Ein schwarzer Mittwoch (Seite 8). In: ComputerBase. Abgerufen am 7. Juni 2021.</ref> Jedes Modul besitzt zwei symmetrische 128-Bit-FMAC-Gleitkommapipelines, die bei Bedarf in eine 256-Bit-breite Einheit umfunktioniert und damit für einen FMA-Befehl verwendet werden können. FMA rundet anders als der Multiply-Add-Befehl erst nach Ende der kompletten Berechnung das Ergebnis. Alle Module einer CPU teilen sich den ggf. vorhandenen L3-Cache sowie das Dual-Channel Interface.

Befehlssatzerweiterungen

AMD unterstützt mit der Bulldozer-Mikroarchitektur diverse Instruktionen wie Intels AVX („Advanced Vector Extensions“), SSE4.1, SSE4.2, AES-NI, CLMUL, als auch von AMD entwickelte Instruktionen (XOP, FMA4). Das von AMD entwickelte 3DNow! fällt mit dieser Generation erstmals weg.<ref>Volker Rißka: AMD Bulldozer im Test: Ein schwarzer Mittwoch (Seite 9). In: ComputerBase. Abgerufen am 7. Juni 2021.</ref>

Implementierung

Datei:AMD Bulldozer block diagram (8 core CPU).PNG
AMD Bulldozer block diagram (8 core CPU)

Mikroprozessoren auf Bulldozer-Basis wurden 2011 von AMD zunächst nur in der „Enthusiasten“-Serie (als AMD FX) und im Serverbereich (als AMD Opteron) in den Markt eingeführt. Für die Verwendung in Servern werden sowohl CPUs mit zwei Dies unter einem Integrated Heatspreader (IHS) mit dem Codenamen Interlagos (bis zu 16 Threads) auf dem Sockel G34 vertrieben, als auch CPUs mit einem Die unter dem IHS mit dem Codenamen Valencia (4 bis 8 Threads) auf dem Sockel C32. Diese sind, anders als bei den Consumer-Versionen, als LGA-CPUs konzipiert. Alle bisherigen CPUs auf Bulldozer-Basis, einschließlich der aktuellen Piledriver-Revision, werden bei GlobalFoundries im 32-Nanometer-SOI-HKMG-Verfahren gefertigt. Ein Modul des Orochi-Dies, das die Basis für CPUs der Typen Zambezi (FX-Serie) und Valencia (Opteron-Serie) bildet, beinhaltet auf einer Fläche von 30,9 mm² ca. 213 Millionen Transistoren.

Piledriver

Piledriver heißt die erste Überarbeitung von AMDs Umsetzung der Clustered-Integer-Core-Architektur. Sie wurde im Jahr 2012 vorgestellt und sollte in allen Anwendungsbereichen Einzug halten: im Server-Segment weiterhin als Opteron, im APU-Segment unter dem Codenamen Trinity sowie als Ersatz für die erste Generation der FX-CPUs.

Neben Verbesserungen bei der Sprungvorhersage und der Auslastung der Pipelines wurden folgende Neuerungen eingeführt:<ref>Don Woligroski: AMD A10-4600M Review: Mobile Trinity Gets Tested. In: Tom’s Hardware. 15. Mai 2012, abgerufen am 7. Juni 2021 (Abschnitt The CPU Side: An All-New Piledriver Core).</ref>

  • Unterstützung von FMA3, welches von Intel erst mit der Haswell-Architektur eingeführt wurde
  • Instruktionen zur Bit(masken)manipulation: BMI1 (Intel-kompatibel) und TBM (AMD-spezifisch)
  • Unterstützung für Gleitkommazahlen halber Genauigkeit: F16C
  • Überarbeiteter und schnellerer L2-Cache
  • Neue Clock-Mesh (nur bei Trinity-Version)
  • Doppelt so großer Level 1 TLB für Daten (64 statt 32 Einträge)

Neben Trinity basiert auch das 2013 vorgestellte Prozessor-Stepping Richland auf Piledriver-CPU-Kernen.

Weblinks

Einzelnachweise

<references />

<templatestyles src="Erweiterte Navigationsleiste/styles legacy.css" />Vorlage:Klappleiste/Anfang

Mikroarchitekturen

Am29000 • Am286 • Am386 • Am486 • 5x86 • K5 • K6 • K6-2 • K6-III • K7 • K8/K8L • K9 • K10 • Bobcat • Bulldozer • Jaguar • Steamroller • PumaZen/Zen+ • Zen 2 • Zen 3/Zen 3+ • Zen 4/Zen 4c • Zen 5/Zen 5c

Technologien

AMD64 • AMD-V • HSA • Mantle • live! • Quad FX • QuantiSpeed • Turbo Core

Chipsätze

690-Serie • 700-Serie • 800-Serie • 900-Serie • AM4 • sTRX4 • AM5

Ryzen
Desktop

Summit Ridge (Serie 1000) • Raven Ridge (Serie 2000) • Pinnacle Ridge (Serie 2000) • Picasso (Serie 3000) • Matisse (Serie 3000) • Renoir (Serie 4000 CPU) • Renoir (Serie 4000 APU) • Vermeer (Serie 5000) • Cezanne (Serie 5000 CPU) • Cezanne (Serie 5000 APU) • Raphael (Serie 7000) • Phoenix (Serie 8000 CPU) • Phoenix (Serie 8000 APU) • Granite Ridge (Serie 9000)

Workstation/HEDT

Whitehaven (Serie 1000) • Colfax (Serie 2000) • Castle Peak (Serie 3000) • Chagall (Serie 5000) • Storm Peak (Serie 7000) • Shimada Peak (Serie 9000)

Mobil

Raven Ridge (Serie 2000) • Dalí (Serie 3000) • Picasso (Serie 3000) • Renoir (Serie 4000 APU) • Lucienne (Serie 5000) • Mendocino (Serie 7020) • Mendocino (Serie 10) • Cezanne und Barcelo (Serie 5000) • Barcelo-R (Serie 7030) • Rembrandt (Serie 6000) • Rembrandt (Serie 100) • Rembrandt-R (Serie 7035) • Phoenix (Serie 7040) • Dragon Range (Serie 7045) • Hawk Point (Serie 8040) • Hawk Point (Serie 200) • Dragon Range (Serie 8045) • Fire Range (Serie 9000) • Strix Point (Serie AI 300) • Krackan Point (Serie AI 300) • Strix Halo (Serie AI Max 300) • Gorgon Point (Serie AI 400)

Embedded

Ryzen Embedded R (Serie 1000) • Ryzen Embedded V (Serie 1000) • Ryzen Embedded R (Serie 2000) • Ryzen Embedded V (Serie 2000) • Ryzen Embedded V (Serie 3000) • Ryzen Embedded (Serie 5000) • Ryzen Embedded (Serie 7000) • Ryzen Embedded (Serie 8000)

Epyc
Fusion APUs
Desktop
auch in Notebooks

Llano (K10) • Trinity, Richland (Piledriver) • Kaveri (Steamroller) • Carrizo, Bristol Ridge (Excavator)

Mobil
Subnotes, Tablets

Ontario, Zacate (Bobcat) • Kabini, Temash (Jaguar) • Beema, Mullins (Puma)

Embedded

Ontario G-Serie

Opteron
Phenom
Desktop

Phenom • Phenom II

Mobil

Phenom II

Athlon
Turion
Sempron
Duron
Desktop

Duron

Mobil

Mobile Duron

Geode
Embedded

GX • LX • NX • NX 2001

Alchemy
Embedded

Alchemy

Vorlage:Klappleiste/Ende