<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Cell_%28Prozessor%29</id>
	<title>Cell (Prozessor) - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://wiki-de.moshellshocker.dns64.de/index.php?action=history&amp;feed=atom&amp;title=Cell_%28Prozessor%29"/>
	<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Cell_(Prozessor)&amp;action=history"/>
	<updated>2026-06-09T10:50:04Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Wikipedia (Deutsch) – Lokale Kopie</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://wiki-de.moshellshocker.dns64.de/index.php?title=Cell_(Prozessor)&amp;diff=239209&amp;oldid=prev</id>
		<title>imported&gt;Fan-vom-Wiki: Tippfehler (Leerzeichen)</title>
		<link rel="alternate" type="text/html" href="https://wiki-de.moshellshocker.dns64.de/index.php?title=Cell_(Prozessor)&amp;diff=239209&amp;oldid=prev"/>
		<updated>2025-02-16T23:13:34Z</updated>

		<summary type="html">&lt;p&gt;Tippfehler (Leerzeichen)&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;Cell&amp;#039;&amp;#039;&amp;#039; (oder auch &amp;#039;&amp;#039;Cell-Broadband-Engine&amp;#039;&amp;#039;) ist eine [[Prozessor]]serie, die von [[IBM]] gemeinsam mit [[Sony]] und [[Toshiba]] entwickelt wurde. Die Prozessoren zeichnen sich durch die Nutzung eines [[64-Bit]]-[[PowerPC]]-Kernes, einer [[Pipeline (Prozessor)|Pipeline]]-Architektur, Unterstützung für [[Simultaneous Multithreading]] und den Einsatz einer heterogenen [[Mehrkernprozessor|Mehrkern-Architektur]] aus, wodurch sie für paralleles Rechnen prädestiniert sind.&lt;br /&gt;
&lt;br /&gt;
== Aufbau ==&lt;br /&gt;
[[Datei:Schema Cell.png|mini|Schema des Cell-Prozessors]]&lt;br /&gt;
Das Grundkonzept der Cell-Prozessoren sieht acht &amp;#039;&amp;#039;Synergistic Processing Elements&amp;#039;&amp;#039; (SPE) und ein &amp;#039;&amp;#039;[[PowerPC]] Processing Element&amp;#039;&amp;#039; (PPE) vor. Die einzelnen [[Prozessorkern]]e sind über einen &amp;#039;&amp;#039;Element Interconnect Bus&amp;#039;&amp;#039; (EIB) gekoppelt, der Daten mit bis zu 96&amp;amp;nbsp;Byte pro CPU-Takt übertragen kann. Sowohl das PPE als auch die SPEs können pro CPU-Takt mit 8&amp;amp;nbsp;Bytes auf den EIB zugreifen. Der EIB ist dabei als Ringbus (4×&amp;amp;nbsp;128&amp;amp;nbsp;Bit) realisiert und wird mit halbem CPU-Takt getaktet. Der Zugriff auf den Hauptspeicher erfolgt über einen Memory Interface Controller (MIC).&amp;lt;ref&amp;gt;D. Pham, S. Asano, M. Bolliger, M. Day, H. Hofstee, C. Johns, J. Kahle, A. Kameyama, J. Keaty, Y. Masubuchi, M. Riley, D. Shippy, D. Stasiak, M. Suzuoki, M. Wang, J. Warnock, S. Weitzel, D. Wendel, T. Yamazaki und K. Yazawa: &amp;#039;&amp;#039;The design and implementation of a first-generation CELL processor&amp;#039;&amp;#039;. International Solid-State Circuits Conference, Februar 2005, S. 184–185&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Synergistic Processing Element (SPE) ===&lt;br /&gt;
Jedes SPE besteht aus einer Recheneinheit ([[Arithmetisch-logische Einheit|ALU]]) mit vierfachem [[SIMD]], bezeichnet als &amp;#039;&amp;#039;[[Synergistic Processing Unit]]&amp;#039;&amp;#039; (SPU oder auch SPX). Diese verfügt über 128&amp;amp;nbsp;[[Register (Prozessor)|Register]], die jeweils 128&amp;amp;nbsp;[[Bit]] groß sind. Zum SPE gehört weiterhin ein &amp;#039;&amp;#039;Memory Flow Controller&amp;#039;&amp;#039; (MFC), der [[Speicherdirektzugriff|DMA]]-Übertragungen zum Hauptspeicher oder zu anderen SPEs steuert, sowie ein eigener lokaler Speicher von 256&amp;amp;nbsp;[[Byte|kB]].&lt;br /&gt;
&lt;br /&gt;
==== Lokaler Speicher und Speicherverwaltung ====&lt;br /&gt;
Der lokale Speicher (auch &amp;#039;&amp;#039;Load Store Unit&amp;#039;&amp;#039;, kurz LS) besteht aus vier getrennten 64&amp;amp;nbsp;kB großen Speicherblöcken mit sechs Takten Latenzzeit.&amp;lt;ref&amp;gt;{{Internetquelle |autor=David T. Wang |url=https://www.realworldtech.com/cell/ |titel=ISSCC 2005: The CELL Microprocessor |werk=real world technologies |datum=2005-02-10 |sprache=en-US |abruf=2024-02-15}}&amp;lt;/ref&amp;gt; Direkt kann eine SPU lediglich mit dem lokalen Speicher kommunizieren. Für Zugriffe oder Kommunikation mit dem Hauptspeicher, der PPE oder anderen SPUs zeichnet ein &amp;#039;&amp;#039;Memory Flow Controller&amp;#039;&amp;#039; (MFC) verantwortlich, welcher komplett unabhängig agiert. Damit lässt sich der Speicher der einzelnen SPEs theoretisch frei aufteilen oder auch mit spezifischen Zugriffsrechten schützen. Insgesamt sind 16&amp;amp;nbsp;Speicheraktionen mit dem MFC gleichzeitig möglich.&amp;lt;ref name=&amp;quot;cell kultur&amp;quot;&amp;gt;&amp;#039;&amp;#039;Cell-Kultur – Innenleben und Programmierung des Cell-Prozessons&amp;#039;&amp;#039;. In: &amp;#039;&amp;#039;[[c’t]]&amp;#039;&amp;#039;, S. 28&amp;amp;nbsp;ff., Ausgabe &amp;#039;&amp;#039;c’t&amp;#039;&amp;#039; special 01/07 - Playstation 3&amp;lt;/ref&amp;gt;&amp;lt;br /&amp;gt; Mit dem vollständigen Verzicht auf [[Cache]] zugunsten eines direkt adressierbaren und [[Static random-access memory|SRAM]] basierten lokalen Speichers können Speicherlatenzen gegenüber einer Cache-gestützten [[In-order execution|In-Order]]-Architektur kontrolliert und entsprechend gering gehalten werden. Dank dieser Methode können Programmabläufe sowohl durch [[Compiler]] als auch durch direkte Programmierung in hohem Maße kontrolliert werden, sodass [[Out-of-order execution]] oder ausgefeilte [[Sprungvorhersage]]n, die unnötig die Komplexität des Prozessors erhöht hätten, für eine hohe Performance überflüssig wurden.&amp;lt;ref name=&amp;quot;in order with no cache&amp;quot;&amp;gt;{{Internetquelle |autor=Anand Lal Shimpi |url=https://www.anandtech.com/show/1647 |titel=Understanding the Cell Microprocessor |werk=Anand Tech |datum=2005-03-17 |sprache=en |abruf=2024-02-15}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
[[Datei:SPE (cell).png|mini|Schema der SPE]]&lt;br /&gt;
&lt;br /&gt;
==== Synergistic Processing Unit (SPU) ====&lt;br /&gt;
Eine SPU arbeitet mit zwei [[Pipeline (Prozessor)|Pipelines]] (&amp;#039;&amp;#039;even&amp;#039;&amp;#039; und &amp;#039;&amp;#039;odd&amp;#039;&amp;#039;), die insgesamt 23-Stufen lang sind. Die &amp;#039;&amp;#039;even&amp;#039;&amp;#039; Pipeline beherbergt die Floating Point und Fixed Point Units, während sich sämtliche andere Funktionseinheiten auf der &amp;#039;&amp;#039;odd&amp;#039;&amp;#039; Pipeline befinden. Eine SPU kann zwei Instruktionen pro Takt ausführen (&amp;#039;&amp;#039;dual issue&amp;#039;&amp;#039;), davon je eine pro Pipeline. Dies entspricht maximal acht Gleitkommaoperationen pro Takt bei einfacher Genauigkeit. Bei 3,2&amp;amp;nbsp;GHz Taktrate ergibt sich somit eine theoretische Leistung von 25,6 GFLOPS pro SPU.&amp;lt;ref name=&amp;quot;cell explained&amp;quot;&amp;gt;{{Internetquelle |autor=Nicholas Blachford |url=http://www.blachford.info/computer/Cell/Cell0_v2.html |titel=Cell Architecture Explained Version 2 |werk=blachford.info |datum=2005 |sprache=en |abruf=2024-02-15}}&amp;lt;/ref&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
Implementiert ist lediglich eine statische Sprungvorhersage. Wichtig ist in diesem Bezug deshalb die Leistung des Compilers, da [[Pipeline-Hazard]]s eine Wartezeit von 18&amp;amp;nbsp;Takten nach sich ziehen. Die hohe Anzahl an Registersätzen hilft zusätzlich Latenzen zu überbrücken, indem Schleifen aufgelöst ([[Loop unrolling]]) oder Algorithmen mehrfach parallel ausgeführt werden können.&amp;lt;ref name=&amp;quot;cell kultur&amp;quot; /&amp;gt;&amp;lt;br /&amp;gt;&lt;br /&gt;
Bei den SPUs handelt es sich nicht um [[Koprozessor]]en. Sie können unabhängig voneinander arbeiten und sind zudem kompatibel zu PPE-Programmcode, sofern dieser rekompiliert und um DMA-Calls erweitert wurde. Obwohl SPUs für spezifischere Anwendungsgebiete entworfen wurden, handelt es sich um Prozessoren mit General Purpose [[Befehlssatz|Instruction Set]].&amp;lt;ref&amp;gt;{{Internetquelle |autor=Jim Tilander, Vassily Filippov |url=https://www.tilander.org/aurora/comp/gdc2009_Tilander_Filippov_SPU.pdf |titel=Practical SPU Programming in God of War III |werk=tilander.org |sprache=en |abruf=2024-02-15}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Internetquelle |autor=Michiel van der Leeuw |url=https://www.guerrilla-games.com/media/News/Files/GDC09-vanderLeeuw-KZ2SPUsCaseStudy.pdf |titel=The PlayStation 3’s SPUs in the Real World |hrsg=Guerrilla Games |datum=2009-03-23 |format=PDF; 60 MB |sprache=en |abruf=2024-02-15}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
[[Datei:PPE (Cell).png|mini|Schema der PPE]]&lt;br /&gt;
&lt;br /&gt;
=== Power Processor Element (PPE) ===&lt;br /&gt;
Der Steuerprozessor (PPE) basiert auf der [[64-Bit]]-PowerPC-Architektur von [[IBM]], dessen [[Pipeline (Prozessor)|Pipeline]] aber im Vergleich zu üblichen PowerPC-Prozessoren {{lang|en|in order}}, das heißt nacheinander abarbeitend, arbeitet. Jedoch verfügt das PPE über &amp;#039;&amp;#039;Delayed-Execution Pipelines&amp;#039;&amp;#039;, welche Out-Of-Order Execution zumindest für Load Instructions erlauben.&amp;lt;ref name=&amp;quot;cellperformance&amp;quot;&amp;gt;{{Literatur |Autor=T. Chen, R. Raghavan, J. N. Dale, E. Iwata |Titel=Cell Broadband Engine Architecture and its first implementation—A performance view |Sammelwerk=IBM Journal of Research and Development |Band=51 |Nummer=5 |Datum=2007-09-05 |Seiten=559–572}}&amp;lt;/ref&amp;gt; Da er zwei [[Thread (Informatik)|Threads]] gleichzeitig abarbeiten kann, entstehen bei entsprechend eingerichteten Programmen die üblichen In-Order-Nachteile durch blockierte Pipelines in geringerem Maße. Dem PPE stehen 512&amp;amp;nbsp;KB L2-[[Cache]] zur Verfügung. Insgesamt verfügt die [[Prozessor|CPU]] also über 2,5&amp;amp;nbsp;MB internen Speicher.&lt;br /&gt;
&lt;br /&gt;
== Geschichte ==&lt;br /&gt;
Der Cell-Prozessor ist eine Gemeinschaftsentwicklung von Sony, Toshiba und IBM. Die Entwicklung begann im März 2001 in einem Entwicklungscenter in [[Austin (Texas)|Austin]] unter Beteiligung von Ingenieuren aller drei Firmen. Es waren zusammen über 400&amp;amp;nbsp;Fachkräfte, verteilt über zehn Standorte weltweit, in die Entwicklung des Cell involviert. Die Synergistic Processing Units wurden dabei weitgehend am IBM-Standort im schwäbischen [[Böblingen]] entworfen.&amp;lt;ref name=&amp;quot;cell kultur&amp;quot; /&amp;gt;&amp;lt;ref name=&amp;quot;cell explained&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Insgesamt veranschlagte die Entwicklung über 400&amp;amp;nbsp;Millionen US-Dollar,&amp;lt;ref&amp;gt;{{Internetquelle |url=https://www.forbes.com/forbes/2006/0130/076.html |titel=Holy Chip! |werk=Forbes |datum=2006-01-30 |sprache=en |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; weitere Milliarden wurden in die Errichtung von [[Foundry]]s investiert, darunter am IBM-Produktionsstandort in East Fishkill, New York.&amp;lt;ref name=&amp;quot;cell explained&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Der erste Cell-Prozessor wurde in 90&amp;amp;nbsp;nm [[Strukturgröße]] im [[Silicon-on-Insulator|SOI-Verfahren]] gefertigt, dabei erreichte das [[Die (Halbleitertechnik)|Die]] eine Fläche von rund 235&amp;amp;nbsp;mm². Berichte vor April 2005, die sich auf einen früheren Prototyp (&amp;#039;&amp;#039;DD1&amp;#039;&amp;#039;) des Prozessors beziehen, sprechen von einer geringfügig kleineren Die-Fläche von 221&amp;amp;nbsp;mm². Die finale Version (&amp;#039;&amp;#039;DD2&amp;#039;&amp;#039;) verfügt über ein verbessertes PPE mit höherer [[SIMD]]-Leistung, welche mehr Platz beansprucht.&amp;lt;ref&amp;gt;{{Internetquelle |autor=David T. Wang |url=https://www.realworldtech.com/cell-update/ |titel=CELL Microprocessor III |werk=real world technologies |datum=2005-07-24 |sprache=en-US |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; Ab März 2007 stellte IBM den Prozessor in 65-nm-Verfahren her, was zu einer kleineren Die-Fläche und somit zu geringeren Fertigungskosten führte.&amp;lt;ref&amp;gt;{{Internetquelle |autor=Candice Jones |url=https://www.itweb.co.za/article/ibm-produces-advanced-cell-processor/KBpdgvpadxl7LEew |titel=IBM produces advanced Cell processor |werk=IT Web |datum=2007-03-14 |sprache=en |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; Mit Einführung der PlayStation&amp;amp;nbsp;3 Slim im August 2009 folgte ein weiterer [[Shrink]] auf 45&amp;amp;nbsp;nm bei einer Fläche von lediglich 115&amp;amp;nbsp;mm².&amp;lt;ref&amp;gt;{{Internetquelle |autor=Ben Kuchera |url=https://arstechnica.com/gaming/2009/08/sony-answers-our-questions-about-the-new-playstation-3/ |titel=Sony answers our questions about the new PlayStation 3 |werk=ars technica |datum=2009-08-18 |sprache=en-us |abruf=2024-04-29}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
2007 wurde eine verbesserte Variante des Cell-Prozessors auf den Markt gebracht, der &amp;#039;&amp;#039;PowerXCell 8i&amp;#039;&amp;#039;. Dieser wurde bereits vom Start weg in 65&amp;amp;nbsp;nm gefertigt und unterstützt im Vergleich zu seinem Vorgänger Berechnungen mit [[Gleitkommazahl]]en [[Doppelte Genauigkeit|doppelter Genauigkeit]] nativ, das heißt ohne Hilfsfunktionen und damit wesentlich schneller.&lt;br /&gt;
&lt;br /&gt;
== Einsatz ==&lt;br /&gt;
[[Datei:CELL BE processor PS3 board (cropped).jpg|mini|CELL BE einer PlayStation 3]]&lt;br /&gt;
Der Cell-Prozessor wurde mit speziellem Augenmerk auf breitbandige Berechnungsanwendungen entwickelt, vor allem Grafikberechnung und Videokodierung/-dekodierung. Die erste kommerzielle Verwendung fand das Design im September 2006 in IBM-[[Bladeserver]]n mit acht SPEs.&amp;lt;ref&amp;gt;{{Internetquelle |autor=Christof Windeck |url=https://www.heise.de/news/IBM-stellt-Blade-Server-Modul-mit-Cell-Prozessoren-vor-162045.html |titel=IBM stellt Blade-Server-Modul mit Cell-Prozessoren vor |werk=heise online |datum=2006-09-13 |sprache=de |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; Bekannt wurde der Prozessor aber vor allem durch seinen Einsatz in Sonys Spielkonsole [[PlayStation&amp;amp;nbsp;3]], wo er mit 3,2-GHz-Takt läuft, jedoch nur mit sieben SPEs. So können auch Cell-Chips mit nur sieben funktionierenden SPEs noch verwendet werden, wodurch die Kosten gesenkt werden können. Auch mit nur sieben SPEs erreicht der Prozessor aber eine theoretische Spitzenleistung von über 200&amp;amp;nbsp;GFlops bei einfach genauen Gleitkommazahlen, was den Prozessoren der Konkurrenzkonsolen der siebten Generation ([[Xbox 360]] und [[Wii]]) überlegen ist.&lt;br /&gt;
&lt;br /&gt;
Des Weiteren wird der Prozessor auch in Fernsehern mit erweiterten Videofunktionen eingesetzt,&amp;lt;ref&amp;gt;{{Internetquelle |autor=Jon Stokes |url=https://arstechnica.com/uncategorized/2005/05/4872-2/ |titel=Toshiba shows a video of a demo of Cell decoding 48 MPEG-2 video streams at once |werk=ars technica |datum=2005-05-03 |sprache=en-us |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; Cell-Derivate mit nur vier SPEs und zusätzlicher Hardware zur Videokodierung und -dekodierung finden auch in speziellen Notebooks von Toshiba&amp;lt;ref&amp;gt;{{Internetquelle |autor=Jens Ihlenfeld |url=https://www.golem.de/sonstiges/zustimmung/auswahl.html?from=https%3A%2F%2Fwww.golem.de%2F0806%2F60467.html |titel=Toshiba Qosmio G55 - erstes Notebook mit SpursEngine |werk=Golem.de |datum=2008-06-18 |sprache=de |abruf=2024-04-29}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Internetquelle |autor=Dan Ackerman |url=https://www.cnet.com/reviews/toshiba-qosmio-g55-q802-review/ |titel=Toshiba Qosmio G55-Q802 review |werk=CNET |datum=2008-10-08 |sprache=en |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; sowie in Erweiterungskarten für PCs Verwendung.&amp;lt;ref&amp;gt;{{Internetquelle |autor=Don Woligroski |url=https://www.tomshardware.com/reviews/leadtek-winfast-pxvc1100,2523.html |titel=The WinFast PxVC1100 Video Transcoding Card: Worth The Price? |werk=tomshardware.com |datum=2010-01-28 |sprache=en |abruf=2024-04-29}}&amp;lt;/ref&amp;gt; Der Nachfolgeprozessor PowerXCell 8i wurden ab Mitte 2008 in Servern eingesetzt.&amp;lt;ref&amp;gt;{{Internetquelle |autor=Christof Windeck |url=https://www.heise.de/news/IBM-kuendigt-HPC-Blade-QS22-mit-Cell-Derivat-PowerXCell-8i-an-207529.html |titel=IBM kündigt HPC-Blade QS22 mit Cell-Derivat PowerXCell 8i an |werk=heise online |datum=2008-05-14 |sprache=de |abruf=2024-04-29}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Weitere Informationen ==&lt;br /&gt;
[[Datei:Peter Hofstee.jpg|mini|[[H. Peter Hofstee|Peter Hofstee]], einer der leitenden Architekten des Prozessors]]&lt;br /&gt;
Im [[LINPACK]]-Leistungsvergleich mit anderen Prozessoren schneidet der Cell BE wie folgt ab:&amp;lt;ref name=&amp;quot;cellperformance&amp;quot; /&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable sortable&amp;quot; style=&amp;quot;text-align:right&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| LINPACK (DP)&lt;br /&gt;
!Takt-&amp;lt;br&amp;gt;frequenz&lt;br /&gt;
!theoretische&amp;lt;br&amp;gt;Leistung&lt;br /&gt;
!durchschnittliche&amp;lt;br /&amp;gt;Leistung&lt;br /&gt;
!Effizienz&lt;br /&gt;
!Matrix&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| Cell BE{{FN|a}}&lt;br /&gt;
| 3,2&amp;amp;nbsp;GHz || 100,00 GFlops || {{FN|b}} || {{FN|b}} || 4k×4k&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| SPU{{FN|c}}&lt;br /&gt;
| 3,2&amp;amp;nbsp;GHz || 1,83 GFlops || 1,45 GFlops || 79,23 % || 1k×1k&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| 8 SPUs{{FN|c}}&lt;br /&gt;
| 3,2&amp;amp;nbsp;GHz || 14,63 GFlops || 9,46 GFlops || 64,66 % || 1k×1k&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| [[Intel Pentium 4|Pentium 4]]&lt;br /&gt;
| 3,2&amp;amp;nbsp;GHz || 6,40 GFlops || 3,10 GFlops || 48,44 % || 1k×1k&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| Pentium 4 + SSE3&lt;br /&gt;
| 3,6&amp;amp;nbsp;GHz || 14,40 GFlops || 7,20 GFlops || 50,00 % || 1k×1k&lt;br /&gt;
|-&lt;br /&gt;
!style=&amp;quot;text-align:left&amp;quot;| [[Intel Itanium|Itanium]]&lt;br /&gt;
| 1,6&amp;amp;nbsp;GHz || 6,40 GFlops || 5,95 GFlops || 92,97 % || 1k×1k&lt;br /&gt;
|}&lt;br /&gt;
{{FNBox|&lt;br /&gt;
  {{FNZ|a|Implementierung unter [[Jack Dongarra]]}}&lt;br /&gt;
  {{FNZ|b|unbekannt}}&lt;br /&gt;
  {{FNZ|c|Implementierung unter [[IBM]]}}&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
Die Werte beziehen sich auf doppelt genaue Gleitkommazahlen (64&amp;amp;nbsp;Bit), für welche die SPUs des Cell-Prozessors nicht ausgelegt sind. Mithilfe der für doppelten Genauigkeit optimierten [[AltiVec|VMX]]-Einheit im PPE gelingt dem Cell-Prozessor unter der Implementierung von IBM bis zu 21,03&amp;amp;nbsp;GFlops. Eine Arbeitsgruppe unter der Leitung von Jack Dongarra optimierte den Code durch die Nutzung eines [[Iterative Refinement|iterativen Verfahrens]]. Damit lässt sich unter LINPACK bei doppelter Genauigkeit eine Performance entsprechend 100&amp;amp;nbsp;GFlops auf einer 4K×4K-Matrix erreichen. Das PPE trägt dabei zwar ebenfalls nicht zur eigentlichen Berechnung bei, dient jedoch als Steuereinheit der SPUs.&amp;lt;ref&amp;gt;[http://www.netlib.org/lapack/lawnspdf/lawn175.pdf &amp;#039;&amp;#039;Exploiting the Performance of 32 bit Floating Point Arithmetic in Obtaining 64 bit Accuracy&amp;#039;&amp;#039;.] (PDF; 227&amp;amp;nbsp;kB), 31. Oktober 2006 (englisch); abgerufen am 5. Januar 2011.&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
LINPACK-Berechnungen mit einfach genauen Gleitkommazahlen (32&amp;amp;nbsp;Bit) erreichen auf einem Cell-Prozessor mit acht SPUs über 73&amp;amp;nbsp;GFlops. Mit zunehmender Matrixgröße steigt die Recheneffizienz, so dass 8&amp;amp;nbsp;SPUs auf einer 4K×4K-Matrix unter LINPACK etwa 156&amp;amp;nbsp;GFlops erreichen.&lt;br /&gt;
&lt;br /&gt;
Zudem ist es auch interessant, den Cell-Prozessor mit anderen Multiprozessoren zu vergleichen:&lt;br /&gt;
{| class=&amp;quot;wikitable sortable&amp;quot; style=&amp;quot;text-align:right&amp;quot;&lt;br /&gt;
|+ Multi-Array-Prozessoren&amp;lt;ref&amp;gt;&amp;#039;&amp;#039;Zelluläre Strukturen&amp;#039;&amp;#039;. In: &amp;#039;&amp;#039;[[c’t]]&amp;#039;&amp;#039;, 12/2007, S. 196&amp;amp;nbsp;ff.&amp;lt;/ref&amp;gt;&lt;br /&gt;
|-&lt;br /&gt;
! Hersteller&lt;br /&gt;
! Prozessor&lt;br /&gt;
! Kerne&lt;br /&gt;
! SIMD-&amp;lt;br /&amp;gt;Einheiten&lt;br /&gt;
! Takt&amp;lt;br /&amp;gt;(GHz)&lt;br /&gt;
! FMUL+FADD&amp;lt;br /&amp;gt;(GFLOPS)&lt;br /&gt;
! Spitzenleistung&amp;lt;br /&amp;gt;(GFLOPS)&lt;br /&gt;
! [[Basic Linear Algebra Subprograms|BLAS]]/SGEMM&amp;lt;br /&amp;gt;(GFLOPS)&lt;br /&gt;
! Verlustleistung&amp;lt;br /&amp;gt;([[Watt (Einheit)|Watt]])&lt;br /&gt;
! Ausführung&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| IBM ||style=&amp;quot;text-align:left&amp;quot;| Cell BE{{FN|a}}&lt;br /&gt;
| 8 || 4 || 3,2{{0|00}} || 2 || 204,8 || 201 || 80&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Prozessor&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| [[Nvidia]] ||style=&amp;quot;text-align:left&amp;quot;| [[Nvidia-GeForce-8-Serie|8800Ultra]] (G80)&lt;br /&gt;
| 128    || 1 || 1,512 || 2 || 387,1 || {{FN|b}} || &amp;gt;170&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| [[Grafikkarte|Karte]]&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Nvidia ||style=&amp;quot;text-align:left&amp;quot;| [[Nvidia-GeForce-8-Serie|8800GTX]] (G80)&lt;br /&gt;
| 128    || 1 || 1,350 || 2 || 345,6 || 105{{FN|c}} || 120–170&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Karte&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Nvidia ||style=&amp;quot;text-align:left&amp;quot;| [[Nvidia-GeForce-200-Serie|GT200b]]&lt;br /&gt;
| 240    || 1 || 1,476 || n/a || 1062,7 || {{FN|b}} || 180–240&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Karte&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| [[ATI Technologies|ATI]] ||style=&amp;quot;text-align:left&amp;quot;| [[ATI-Radeon-HD-2000-Serie|HD2900 XT]] (R600)&lt;br /&gt;
| 320    || 5 || 0,742 || 2 || 474,9 || {{FN|b}} || 150–200&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Karte&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| ATI ||style=&amp;quot;text-align:left&amp;quot;| [[ATI-Radeon-X1-Serie|1900XTX]] (R580)&lt;br /&gt;
| 48     || 4 || 0,65{{0}} || 2 || 249,6 || 120 || 130–170{{FN|d}}&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Karte&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| ATI ||style=&amp;quot;text-align:left&amp;quot;| [[ATI-Radeon-HD-4000-Serie|RV770]]&lt;br /&gt;
| 800    || 5 || 0,75{{0}} || n/a || 1200 || {{FN|b}} || 80–160&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Karte&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| ClearSpeed ||style=&amp;quot;text-align:left&amp;quot;| CSX700&amp;lt;ref&amp;gt;clearspeed.com: {{Webarchiv|text=&amp;#039;&amp;#039;Products –  CSX700&amp;#039;&amp;#039; |url=http://www.clearspeed.com/products/csx700.php |wayback=20090518203226 }}&amp;lt;/ref&amp;gt;&lt;br /&gt;
| 192    || 1 || 0,25{{0}} || 2 || 96 || 80 || 10&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Prozessor&lt;br /&gt;
|-&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| ClearSpeed ||style=&amp;quot;text-align:left&amp;quot;| e710&lt;br /&gt;
| 192    || 1 || 0,25{{0}} || 2 || 96 || 80 || 25&lt;br /&gt;
|style=&amp;quot;text-align:left&amp;quot;| Karte&lt;br /&gt;
|}&lt;br /&gt;
{{FNBox|&lt;br /&gt;
  {{FNZ|a|ohne Berücksichtigung des PPE}}&lt;br /&gt;
  {{FNZ|b|unbekannt}}&lt;br /&gt;
  {{FNZ|c|unter [[DirectX]] 9}}&lt;br /&gt;
  {{FNZ|d|ctm}}&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
== Siehe auch ==&lt;br /&gt;
* [[H. Peter Hofstee]]&lt;br /&gt;
* [[Hardwareseitiges Multithreading]]&lt;br /&gt;
* [[Nebenläufigkeit]]&lt;br /&gt;
* [[Parallelrechner]]&lt;br /&gt;
* [[PowerPC]]&lt;br /&gt;
* [[Terascale-Prozessor]]&lt;br /&gt;
* [[TRIPS-Prozessor]]&lt;br /&gt;
&lt;br /&gt;
== Weblinks ==&lt;br /&gt;
{{commonscat|Cell (processor)|Cell-Prozessor}}&lt;br /&gt;
* ibm.com: {{Webarchiv | url=http://www.ibm.com/chips/techlib/techlib.nsf/products/Cell_Broadband_Engine | archive-is=20130126 | text=&amp;#039;&amp;#039;Cell Broadband Engine&amp;#039;&amp;#039; }} ({{enS}})&lt;br /&gt;
* [http://www.blachford.info/computer/Cell/Cell0_v2.html &amp;#039;&amp;#039;Cell Architecture Explained&amp;#039;&amp;#039;.] Details zur Cell Broadband Engine (englisch)&lt;br /&gt;
* [http://www.ibm.com/developerworks/power/cell/ &amp;#039;&amp;#039;Cell Broadband Engine resource center&amp;#039;&amp;#039;.] IBM (englisch)&lt;br /&gt;
&lt;br /&gt;
== Einzelnachweise ==&lt;br /&gt;
&amp;lt;references responsive /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Kategorie:Mikroprozessor]]&lt;br /&gt;
[[Kategorie:Power-Architektur]]&lt;/div&gt;</summary>
		<author><name>imported&gt;Fan-vom-Wiki</name></author>
	</entry>
</feed>