Erste 12-Core-CPU Magny-Cours

Neue Generation im Test - AMD Opteron 6174 mit 12 Kernen

Multitask Floating Point: SPECfp_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Floating-Point-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz. Bei den Floating-Point-Berechnungen von SPECfp_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Floating-Point-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECfp_rate_base2006 der Anzahl der Prozessorkerne des Systems. Beispielsweise arbeiten beim Zwei-Sockel-Server mit Opteron-6174-CPUs 24 Kopien parallel. Beim Westmere-EP-System mit Xeon X5670 und X5680 (Hexa-Core) sind durch das zusätzliche Hyper-Threading 24 virtuelle Kerne vorhanden. Entsprechend laufen auch hier 24 parallele Kopien mit einem Speicherbedarf von 2 GByte RAM pro Kopie.

SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen zieht das Opteron-6174-Päärchen den Opteron-2435-Modellen mit 81 Prozent höherer Leistung davon – trotz 15 Prozent geringerer Taktfrequenz. Die neuen 12-Core-Opterons profitieren deutlich von ihrer hohen Speicherbandbreite mit vier DDR3-1333-Channels pro CPU. Selbst die mit 3,33 GHz arbeitenden Xeon-5680-Modelle können bei identischer Compiler-Einstellung –QxO den Opteron nicht besiegen. Die Xeons müssen sich mit drei DDR3-1333-Channels pro Prozessor begnügen. Durch den hohen RAM-Bedarf von CPU2006 sind zwei DIMMs pro Channel verbaut, der Xeon X5570 schaltet hier auf 1066 MHz zurück.
SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen zieht das Opteron-6174-Päärchen den Opteron-2435-Modellen mit 81 Prozent höherer Leistung davon – trotz 15 Prozent geringerer Taktfrequenz. Die neuen 12-Core-Opterons profitieren deutlich von ihrer hohen Speicherbandbreite mit vier DDR3-1333-Channels pro CPU. Selbst die mit 3,33 GHz arbeitenden Xeon-5680-Modelle können bei identischer Compiler-Einstellung –QxO den Opteron nicht besiegen. Die Xeons müssen sich mit drei DDR3-1333-Channels pro Prozessor begnügen. Durch den hohen RAM-Bedarf von CPU2006 sind zwei DIMMs pro Channel verbaut, der Xeon X5570 schaltet hier auf 1066 MHz zurück.

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für „Non-Intel-Processors“ (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei –QxO wird kein SSE4 verwendet. Zur optimalen Vergleichbarkeit testen wir den Xeon L5520, X5570, X5670 und X5680 ebenfalls mit -QxO. Zusätzlich überprüfen wir bei den Intel-CPUs die Leistungsfähigkeit mit dem Compiler-Flag –fast, der nicht mit den Opterons funktioniert. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung:

SPECfp_rate_base2006

Compiler-Option

-fast (automatisch)

-QxO (SSE3)

Xeon L5520

135

131

Xeon X5570

160

154

Xeon X5670

207

171

Xeon X5680

219

176

Opteron 2435

--

108

Opteron 6174

--

196

Die Xeon-5600-Prozessoren gewinnen durch die Einstellung -fast und SSE4-Support mit zirka 21 bis 24 Prozent massiv an Performance. Durch für den Opteron optimierten Compiler-Versionen lässt sich aber auch bei den AMD-CPUs eine entsprechende Steigerung erreichen.