Effizienz deutlich gesteigert

CPU-Test: AMD 6-Core-Opteron 2435 und 8435

Multitask Floating Point: SPECfp_rate_base2006

Wir setzen die SPEC-Benchmarks unter Windows Server 2008 Enterprise x64 praxisnah ein und kompilieren sie für das Base-Rating. Dazu verwenden wir Intel C++ 10.1 und Fortran 10.1 in der 64-Bit-Version sowie MS Visual Studio 2005 .NET für alle Floating-Point-Tests. Spezielle Bibliotheken für die Optimierung auf den jeweiligen Prozessor kommen nicht zum Einsatz.

Bei den Floating-Point-Berechnungen von SPECfp_rate_base2006 ermittelt die Benchmark-Suite CPU2006 den maximalen Durchsatz durch Verwendung mehrerer Tasks. Dabei arbeiten multiple Kopien des Benchmarks parallel. Die Ergebnisse geben einen guten Anhaltspunkt für die Floating-Point-Leistungsfähigkeit der Prozessoren bei parallel arbeitender Standardsoftware.

Intels 10.1-Compiler bieten mit dem Switch -QxO eine offizielle SSE3-Unterstützung für „Non-Intel-Processors“ (erstmals mit Version 10.0). Mit dieser Compiler-Option führten wir die CPU2006-Benchmarks für die Opteron-Prozessoren durch. Bei den Xeon-CPUs nutzten wir das Compiler-Flag -fast. Hier wählen die Intel-Compiler automatisch die optimale Befehlssatzunterstützung. Zusätzlich testen wir den Xeon X5570 für eine optimale Vergleichbarkeit mit dem Opteron 2435 ebenfalls mit -QxO.

Typischerweise entspricht die Anzahl der Tasks/Kopien von SPECfp_rate_base2006 der Anzahl der Prozessorkerne des Systems. Bei den Zwei-Sockel-Servern mit Quad-Core-Prozessoren arbeiten acht Kopien parallel. Beim Nehalem-EP-System sind durch das zusätzliche Hyper-Threading 16 virtuelle Kerne vorhanden. Entsprechend arbeitet bei den Xeon-X5570-CPUs 16 parallele Kopien. Durch den CPU2006-Speicherbedarf von bis zu 2 GByte RAM pro Kopie erhöhen konnten wir SPECfp_rate_base2006 mit vier Opteron 8435 (24 Kopien) nicht durchführen. Das von AMD zur Verfügung gestellte Testsystem war nur mit 32 GByte RAM bestückt.

SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen ermöglichen zwei Opteron 2435 eine 25 Prozent höhere Performance gegenüber den Opteron-2384-CPUs. Damit bieten zwei 6-Core-Opterons fast die Fließkommaleistung von vier 6-Core-Xeons X7460. Intels Nehalem-basierende Xeon X5570 bleiben aber uneinholbar.
SPECfp_rate_base2006: Bei den sehr speicherintensiven Durchsatztests mit Floating-Point-Programmen ermöglichen zwei Opteron 2435 eine 25 Prozent höhere Performance gegenüber den Opteron-2384-CPUs. Damit bieten zwei 6-Core-Opterons fast die Fließkommaleistung von vier 6-Core-Xeons X7460. Intels Nehalem-basierende Xeon X5570 bleiben aber uneinholbar.