AMD EPYC 7003 Prozessorserie

Vorstellung der dritten Generation der AMD EPYC™, dem leistungsstärksten Serverprozessor der Welt.

AMD stellte kürzlich die neuen AMD EPYC™ Serverprozessoren der dritten Generation vor, die mit dem EPYC™ 7763 den weltweit leistungsstärksten Serverprozessor enthalten. Die AMD EPYC™ 7003 Serie steigert die Produktivität Ihres Unternehmens, indem sie eine schnellere Anwendungsleistung ermöglicht.

EPYC™ in Zahlen

AMD EPYC™ wurde für Rechenzentren entwickelt, die auf CPU-Leistung und Durchsatz angewiesen sind. Von hyperkonvergenter Infrastruktur über Datenbanken bis hin zu Big-Data-Analysen und High-Performance-Computing - Workloads haben mehr Kerne, mit denen sie arbeiten können. AMD EPYC™ Prozessoren der Serie 7003 skalieren von 8 bis 64 Kernen (oder 16 bis 128 Threads pro Sockel). Kein anderer x86-Serverprozessor erreicht dieses Niveau der Kerndichte.

Mit AMD EPYC™ 7003 erhalten Sie eine überragende Workload-Leistung, um die Ressourcen bereitzustellen, die Ihre Anwendungen benötigen.
AMD EPYC Benefits Image
Der neue Prozessorserie AMD EPYC 7003 verspricht mehr Leistung und dieses Versprechen hält es auch, aber dies hat auch seinen Preis. Für das Leistungsplus sorgt die Architektur, denn die Zen-3-Kerne sind für zweistelliges Wachstum gegenüber dem Vorgänger EPYC 7002, Codename Rome, mit Zen-2-Architektur ausgerichtet. 
​​​​​​​
Comparision Between Zen2 and Zen3 Image
AMD hat im Rahmen der Veröffentlichung der neuen AMD EPYC 7003 Referenzdaten im Vergleich zu Intel veröffentlicht. Schaut man auf die nackten Zahlen, dann bietet AMD mit bis zu 64 Kernen pro Sockel, 128 PCI-Express-4.0-Lanes und acht Speicherkanälen für DDR4-3200 derzeit deutlich mehr, als dies bei Intel bis zur Veröffentlichung der neuen Generation "Ice Lake-SP" der Fall ist. Machen Sie sich selbst ein Bild hierzu.
AMD Vs Intel Performance Image

Memory Interleaving

Mit den EPYC-Prozessoren der 7003-Serie führt AMD das Memory Interleaving für die Nutzung von nur sechs der acht zur Verfügung stehenden Speicherkanälen ein. Das Memory Interleaving sorgt hier für günstigere Speicherkonfigurationen mit 4-, 6- oder, wie die Vorgänger, mit einem 8-Kanal-Speicherinterface. DDR4-3200 wird als höchster Takt mit einem DIMM pro Kanal unterstützt, der maximale Speicherausbau liegt bei der Nutzung aller acht Kanäle und insgesamt 16 Slots erneut bei 4 TByte.
EPYC Cpu Memory Interleaving Image
AMD Epyc 7003 unterstützt 8-, 6- und 4-Kanal-Speicher (Bild: AMD)

Das wichtigste Element sind Ihre Daten

In einer Welt voller Komplexität müssen Sie Ihre Workloads sicherer machen, von den Prozessen bis hin zu Ihren Daten. AMD Infinity Guard ist eine in das Silizium integrierte Suite fortschrittlicher Sicherheitsfunktionen zur Abwehr interner und externer Bedrohungen, die Ihre Daten angreifen, und zur Verringerung potenzieller Angriffsflächen beim Booten und Ausführen von Software sowie bei der Verarbeitung Ihrer kritischen Daten.  Mit den AMD Secure Encrypted Virtualization-Technologien, die durch Secure Nested Paging verstärkt werden, trägt AMD zu bahnbrechenden Fortschritten in der Datensicherheit bei, wie z. B. beim vertraulichen Rechnen.
Hardware Validated Boot Image

Überblick über die Mikroarchitektur

Prozessor-Rechenkerne, Speichercontroller, E/A-Controller, RAS und Sicherheitsfunktionen sind alle in den AMD EPYC™ 7003 Series System on Chip (SoC) Prozessor integriert. Der AMD EPYC 7003 Prozessor behält die bewährte Multi-Chip-Modul (MCM) Chiplet-Architektur der früheren erfolgreichen AMD EPYC Prozessoren der Serverklasse bei, während er weitere Verbesserungen vornimmt und die Recheneinheiten auf neue "Zen 3" Kerne aufrüstet.
EPYC 7003 Configuration with 8 CCD and IOD Image
Figure 1 AMD EPYC 7003 configuration with 8 Core Complex Dies (CCD) and Central I/O Die (IOD)

“Zen 3” Core

Der Prozessor der EPYC 7003-Serie basiert auf neuen "Zen 3"-Rechenkernen. Der "Zen 3"-Kern wird in einem 7-nm-Prozess hergestellt und wurde entwickelt, um eine Erhöhung der Anweisungen pro Zyklus (IPC) gegenüber den "Zen"-Kernen der vorherigen Generation zu erreichen. Jeder Kern unterstützt Simultaneous Multi-Threading (SMT), was bei Aktivierung die gleichzeitige Ausführung von 2 Threads pro Kern ermöglicht. Jeder Kern verfügt über einen optimierten 32 KB großen L1-Cache und einen privaten 512 KB großen Unified (Instruction/Data) L2-Cache.

Core Complex (CCX) and Core Complex Die (CCD)

Wie in Abbildung 2 dargestellt, teilen sich bis zu acht "Zen 3"-Core-Recheneinheiten einen L3-Cache der letzten Ebene, der bis zu 32 MB groß sein kann. Diese Gruppierung wird als Core Complex (CCX) bezeichnet. Wenn Simultaneous Multithreading (SMT) auf jedem Kern aktiviert ist, kann ein CCX bis zu 16 gleichzeitige Hardware-Threads, bis zu 4 MB L2-Cache und bis zu 32 MB L3-Cache unterstützen - gemeinsam nutzbar für alle Kerne innerhalb des CCX. Bei der EPYC 7003-Serie ist ein einzelner CCX in einem einzigen Gehäuse, einem sogenannten Core Complex Die (CCD), untergebracht.
CCX and CCD Image
Figure 2 Eight Compute Cores comprise a Core Complex (CCX) within a single die or CCD
EPYC 7003 Processor Internal Topology Image
Figure 3 EPYC 7003 Processor internal topology between CCDs, IO, and DDR Memory Interface within IOD Infinity Fabric

I/O Die (Infinity Fabric™)

Die CCDs sind über den I/O-Die (IOD) mit dem Speicher, dem E/A und untereinander verbunden. Alle CCDs sind mit dem IOD über eine dedizierte Hochgeschwindigkeits- oder GMI-Verbindung (Global Memory Interconnect) verbunden. Das IOD enthält zusätzlich noch Speicherkanäle, PCIe® Gen4-Lanes und Infinity Fabric-Verbindungen. Alle Chips, oder Chiplets, sind miteinander verbunden über AMDs Infinity Fabric Technologie. Der Fabric-Takt (FCLK) kann nun bis zu 1600Mhz betragen und damit mit DDR4-3200 Speicher-DIMMs gekoppelt werden, die ebenfalls mit 1600MHz (MEMCLK) laufen, was die Speicher-Latenzzeit erhöht.
EPYC 7003 SoC Image
Figure 4 EPYC 7003 System on Chip (SoC): 8 CCDs and central IOD

Memory and I/O

In Bezug auf das Speichersubsystem bringt der EPYC 7003 zusätzliche Leistungsstärke und einen neuen 6-Wege-Interleave-Modus. Jeder Prozessor der Serie EPYC 7003 verfügt über 8 Universal Memory Controller (UMC). Jeder UMC oder Speicherkanal kann bis zu 2 DIMMs pro Kanal (DPC) unterstützen, also maximal sechzehn DIMMs pro Sockel. Ein einzelner Prozessor kann 4TB DDR4-Speicher unterstützen. Während 8 Speicherkanäle am gebräuchlichsten sind und im Allgemeinen die beste Leistung bieten, bietet das IOD auch die Flexibilität, 4 und sogar 6 Speicherkanal-Konfigurationen zu unterstützen. Jeder Prozessor verfügt über acht x16-Bit-I/O-Links, die dem PCIe-Subsystem bis zu 128 Lanes mit hoher Geschwindigkeit zur Verfügung stellen PCIe Gen4 I/O für Single-Socket-Plattformen.

NUMA Topology

Die Prozessoren der AMD EPYC 7003 Serie verwenden eine Non-Uniform Memory Access (NUMA) Mikroarchitektur. Darüber hinaus kann ein Benutzer mithilfe von System-BIOS-Einstellungen diese NUMA-Topologie für seine spezifische Betriebsumgebung und Arbeitslast optimieren. Mit der BIOS-Einstellung NUMA Nodes Per Socket (NPS) kann ein System mit verschiedenen NUMA-Konfigurationen eingerichtet werden.
​​​​​​​
Wenn wir zum Beispiel NPS=4 einstellen, wie in Abbildung 4 oben gezeigt, können wir den Prozessor in Quadranten aufteilen. Jeder Quadrant hätte dann 2 CCDs, 2 UMCs und 1 I/O-Hub, wie in dieser Abbildung dargestellt. Der geringste Prozess-Speicher-I/O-Abstand besteht zwischen den Kernen, Speicher-Controllern und E/A innerhalb desselben Quadranten. Der weiteste Abstand ist zwischen einem Core und Speicher-Controller oder IO-Hub in diagonalen Quadranten. Die Lokalisierung von Cores, Speicher und IO in einem NUMA-basierten System ist ein wichtiger Aspekt bei der Leistungsabstimmung. Darüber hinaus steuert die NPS-Einstellung auch das Interleave-Muster der Speicher-Controller. Für jeden NUMA-Knoten werden alle Kanäle innerhalb dieses NUMA-Knotens verschachtelt. Eine Einstellung von NPS=4 partitioniert den Prozessor in vier NUMA-Domänen. Jeder logische Quadrant des Prozessors wird als eigene NUMA-Domäne konfiguriert. Der Speicher ist über die beiden Speicherkanäle in jedem Quadranten verschachtelt. PCIe-Geräte sind in einer der vier NUMA-Domänen des Prozessors lokalisiert, je nachdem, in welchem Quadranten des IO-Die sich die PCIe-Root für dieses Gerät befindet.

​​​​​​​Eine Einstellung von NPS=1 bedeutet hingegen einen einzelnen NUMA-Knoten pro Sockel. Diese Einstellung konfiguriert alle Speicherkanäle auf dem Prozessor zu einer einzigen NUMA-Domäne, d. h. alle Kerne auf dem Prozessor, alle angeschlossenen Speicher und alle mit dem SoC verbundenen PCIe-Geräte befinden sich in einer NUMA-Domäne. Speicherzugriffe werden über alle acht Speicherkanäle in einen einzigen Adressraum verschachtelt. Mit zunehmender Granularität der NPS-Einstellung verringert sich die Anzahl der verschachtelten Kanäle entsprechend. Eine Einstellung von NPS=2 konfiguriert 2 NUMA-Domänen pro Sockel, die entsprechende vier Speicherkanäle innerhalb derselben 4 CCD NUMA-Domäne verschachteln. Die Hälfte der Kerne und die Hälfte der Speicherkanäle jedes SoC werden in einer NUMA-Domäne zusammengefasst, die restlichen Kerne und Speicherkanäle werden in einer zweiten Domäne gruppiert. Der Speicher ist in jeder NUMA-Domäne über die vier Speicherkanäle verschachtelt. Zusätzlich kann in bestimmten Umgebungen die Leistung weiter verbessert werden, indem Arbeitslasten mit Rechenkernen zugeordnet werden, die sich alle einen einzigen LLC teilen. Die LLC (Last Level Cache oder L3-Cache) als NUMA-BIOS Einstellung macht diese Fähigkeit sichtbar. Durch die Aktivierung dieser Einstellung wird jedes CCD mit einer separaten NUMA-Domäne gleichgesetzt, da ein einzigartiger L3-Cache pro CCD. Ein einzelner 7003-Prozessor mit 8 CCDs würde 8 NUMA-Knoten haben. Zusammenfassend lässt sich sagen, dass ein einzelner EPYC-Prozessor der Serie 7003 Konfigurationen unterstützt, die von einem einzelnen NUMA-Knoten-System bis hin zu bis zu 8 NUMA-Knoten pro Sockel. 

Dual-Sockel-Konfigurationen

Prozessoren der Serie EPYC 7003 können in Systemkonfigurationen mit einem oder zwei Sockeln unterstützt werden. Prozessoren mit dem Suffix 'P' in ihrem Namen sind für Ein-Sockel-Konfigurationen ausgelegt. In Zwei-Sockel-Konfigurationen müssen beide Prozessoren identisch sein. Zwei verschiedene Prozessor-OPNs oder Steppings können nicht in demselben 2-Sockel-System verwendet werden. In 2-Sockel-Systemen werden zwei SoCs der EPYC 7003-Serie über ihre entsprechenden Infinity Fabric- oder External Global Memory Interconnect (xGMI)-Links verbunden. Dies schafft eine Verbindung mit hoher Bandbreite und geringer Latenz zwischen den beiden Prozessoren. Systemhersteller können entweder 3 oder 4 Infinity Fabric nutzen.

​​​​​​​Anbindungen je nach E/A- und Bandbreitenzielen des Systemdesigns. In einem 2-Sockel-System gibt es insgesamt 16 Speicherkanäle, 8 pro Sockel. Die Infinity Fabric Links nutzen die gleichen physikalischen Verbindungen wie die PCIe-Lanes im System. In einer Konfiguration mit zwei Sockeln wird also bis zur Hälfte der 128 PCIe-Lanes an jedem Sockel zu Infinity Fabric-Verbindungen. Da jeder Sockel immer noch über 64 PCIe-Lanes verfügt, hat das System immer noch eine Gesamtzahl von 128 PCIe-Lanes pro System. In einigen Fällen möchte ein Systemdesigner vielleicht mehr PCIe-Lanes für das System. In diesen Fällen kann ein Systemdesigner bis zu 160 Lanes für PCIe zuweisen (80 pro Sockel), wobei 48 Lanes pro Sockel für Infinity Fabric-Links übrig bleiben, anstatt 64. Ein System mit zwei Sockeln kann potenziell auf verschiedene Arten konfiguriert werden, einschließlich als 1, 2, 4, 8 oder 16 NUMA-Domänen-System.
EPYC Processor Connection Image
Figure 5 Two EPYC 7003 Processors connect through 4 xGMI links (NPS1)

Führung in der Workload-Performance

Antrieb von Lösungen in der Cloud, on-prem oder off-prem, in Containern oder VMs. Ob auf Bare Metal oder HCI, die AMD EPYC™ 7003 Serie bietet herausragende Leistung über das breite Spektrum von Standardanwendungen.

Als Marktführer im Bereich High-Performance-Computing legt AMD die Messlatte für das Computing im Rechenzentrum weiter hoch, indem das Unternehmen seine Roadmap kontinuierlich umsetzt und sich für Innovationen einsetzt.
Datenblatt
Workstation Performance Image

Das Geheimnis liegt unter der Oberfläche.

Basierend auf dem "Zen 3"-Kern und der AMD Infinity Architecture bieten die neuen Prozessoren der AMD EPYC™ 7003 Serie einen umfassenden Funktionsumfang mit branchenführender E/A, 7-nm-x86-CPU-Technologie und einem integrierten Sicherheitsprozessor auf dem Die.  EPYC™ 7003 CPUs bieten bis zu 32 MB L3-Cache pro Kern, 4-6-8 Speicherkanal-Interleaving für bessere Einsparungen und Leistung in mehreren DIMM-Konfigurationen sowie synchronisierte Takte zwischen Fabric und Speicher, was alles zu einer besseren und schnelleren Zeit bis zu den Ergebnissen führt.

Erfassen Sie den vollen Nutzen Ihrer
​​​​​​​IT-Investitionen

Von der traditionellen Anwendungsbereitstellung bis hin zu den neuesten Innovationen - mit AMD EPYC™ 7003 Prozessoren haben Sie die Systemressourcen und die Kapazität, die Ihre Anwendungen benötigen. 

Seit Januar 2021 gibt über 132 AMD EPYC™ betriebene VMware® zertifizierte Plattformen. Das breite Ökosystem und die Unterstützung für offene Tools und Bibliotheken sind weitere Gründe, warum sich Top-Cloud-Anbieter für AMD entscheiden.

AMD EPYC™ powered Server liefern die Ergebnisse, die Sie brauchen, wenn Sie sie brauchen, und helfen Ihnen, die Auswirkungen auf Ihr Unternehmen schnell zu nutzen - unabhängig davon, wie, wo oder wann Ihre Anwendungen laufen. 
EPYC benefits Image

Modell Spezifikationen

EPYC in Zahlen

AMD EPYC™ wurde für Rechenzentren entwickelt, die auf CPU-Leistung und Durchsatz angewiesen sind. Von hyperkonvergenter Infrastruktur über Datenbanken bis hin zu Big-Data-Analysen und High-Performance-Computing - Workloads benötigen mehr Kerne, mit denen sie arbeiten können. AMD EPYC™ Prozessoren der Serie 7003 skalieren von 8 bis 64 Kernen (oder 16 bis 128 Threads pro Sockel). Kein anderer x86-Serverprozessor erreicht dieses Niveau der Kerndichte.

Mit AMD EPYC™ 7003 erhalten Sie eine überragende Workload-Leistung, um die Ressourcen bereitzustellen, die Ihre Anwendungen benötigen.