Einführung neueR Beschleuniger für KI-Aufgaben durch NVIDIA
starke Virtualisierungsleistung mit NVIDIA A10, A30 und Demnächst A16
Basierend auf der NVIDIA Ampere Architektur bieten A10 und A16 mehr Leistung, Speicher und Benutzerdichte, um jeden Workflow zu beschleunigen, von Grafik und KI bis hin zu VDI. Und in Kombination mit der NVIDIA vGPU Software verbessern die neuen GPUs das Benutzererlebnis, die Leistung und die Flexibilität erheblich.
während der A16-Grafikprozessor eine bis zu 2-fache Benutzerdichte und ein verbessertes VDI-Erlebnis bietet.

NVIDIA A10 liefert leistungsstarke,
flexible Leistung für virtuelle Workstations
Professionelle Anwender nutzen zunehmend fortschrittliche Technologien wie Echtzeit-Raytracing, KI, Compute, Simulation und virtuelle Realität für ihre Arbeit. Aber um diese Workflows auszuführen, und da die Mobilität der Mitarbeiter heutzutage entscheidend ist, benötigen sie mehr Leistung und Flexibilität, um von überall aus arbeiten zu können.
Der NVIDIA A10 in Kombination mit der NVIDIA RTX Virtual Workstation Software liefert die Leistung, um diese komplexen Workflows effizient zu betreiben und gleichzeitig den Mitarbeitern ein optimales Benutzererlebnis zu bieten.
Mit virtuellen Workstations, die vom A10 angetrieben werden, können Unternehmen verbesserte Grafiken und Videos mit KI-beschleunigten Anwendungen von Mainstream-Unternehmensservern bereitstellen.
Da der A10 Grafik- und KI-Workloads auf einer virtualisierten Infrastruktur unterstützen kann, können Rechenzentrumsadministratoren flexibel Ressourcen bereitstellen und jede nicht ausgelastete Rechenleistung nutzen, um KI-Inferenz- oder VDI-Workloads auszuführen.
Der A10 kombiniert RT Cores der zweiten Generation und Tensor Cores der dritten Generation, um Grafik- und Videoanwendungen mit leistungsstarker KI anzureichern. Er wurde speziell für Workstations von Grafik-, Medien- und Spieleentwicklern entwickelt und bietet eine 2,5-mal schnellere Grafikleistung und eine mehr als 2,5-mal höhere Inferenzleistung im Vergleich zur vorherigen Generation der NVIDIA T4 Tensor Core GPU.
Anwender können auf dem A10 auch Inferenz-Workloads mit NVIDIA AI Enterprise Software ausführen und Bare-Metal-Performance erreichen. Der A10 enthält neue Streaming-Mikroprozessoren mit 24 GB GDDR6-Speicher, die vielseitige Grafik-, Rendering-, KI- und Rechenleistung ermöglichen. Der PCIe-Formfaktor mit einfacher Breite und voller Höhe ermöglicht eine GPU-Serverdichte, oft fünf bis sechs GPUs pro Server.

NVIDIA A30 KI-Inferenz und Mainstream-Computing
für jedes Unternehmen
Steigern Sie die Leistung für jeden Enterprise-Workload mit der NVIDIA A30 Tensor-Core-GPU. Mit der NVIDIA Ampere-Architektur-Tensor-Cores und Multi-Instanz-GPU (MIG) sind hohe Geschwindigkeiten sicher über verschiedene Workloads hinweg möglich, einschließlich KI-Inferenz im großen Maßstab und Hochleistungs-Computing(HPC)-Anwendungen. Durch die Kombination schneller Speicherbandbreite und geringen Stromverbrauchs im PCIe-Formfaktor – optimal für Mainstream-Server – ermöglicht die A30 ein flexibles Rechenzentrum und bietet maximalen Nutzen für Unternehmen.
Mit der A30 werden bahnbrechende Funktionen zur Optimierung von Inferenzworkloads genutzt. Sie beschleunigt ein breites Spektrum von Präzisionen, von FP64 über TF32 bis hin zu INT4. Mit der Unterstützung von bis zu vier MIGs pro GPU ermöglicht die A30 den gleichzeitigen Betrieb mehrerer Netzwerke in sicheren Hardwarepartitionen mit garantierter Quality of Service (QoS). Zusätzlich zu den anderen Inferenzleistungssteigerungen der A30 bietet die strukturelle geringe Dichte bis zu 2-mal mehr Leistung.
Bei hochmodernen Gesprächs-KI-Modellen beschleunigt die A30 den Echtzeit-Inferenzdurchsatz um das 3-Fache gegenüber der NVIDIA V100 Tensor-Core-GPU der vorherigen Generation.
Bei der Echtzeit-Bildklassifizierung (die eine Latenz von <7 ms erfordert) beschleunigt die A30 den Durchsatz um das 7-Fache im Vergleich zu NVIDIA T4.
NVIDIA bewies marktführende KI-Leistung bei der Inferenz in MLPerf. In Kombination mit NVIDIA Triton™Inference Server , der KI problemlos in großem Maßstab bereitstellt, ermöglicht die A30 diese bahnbrechende Leistung für jedes Unternehmen.
NVIDIA Ampere-Architektur - Modellvergleich
Virtuelle GPUs - ProduktlinieGPU | A100 Highest Perf. Comute | A30 Mainstream Compute |
---|---|---|
Speichergröße | 40 GB HBM2 | 40 GB GDDR6 |
GPU Architektur | NVIDIA Ampere | NVIDIA Ampere |
Formfaktor | SXM4, and PCIe 4.0 dual slot | PCIe 4.0 dual slot |
Power | 400/250W | 300W |
Virtualisierungs-Workload | Virtualisiertes Computing mit höchster Leistung, einschließlich KI, HPC und Datenverarbeitung, einschließlich Unterstützung für bis zu 7 MIG-Instanzen. Upgradepfad für V100/V100S Tensor Core GPUs. | Mit NVIDIA RTX® Virtual Workstation (vDWS) lassen sich erweiterte und hochwertige 3D-Designs und kreative Workflows entwickeln. Upgradepfad für Quadro RTX™ 8000, RTX 6000. |
Thermal | passive | passive |
vGPU-Softwareunterstützung | vCS | vWS, vPC, vApps, vCS |
GPU | A40 Highest Perf. Compute | A10 Mainstream Graphics | A16 Optimized for VDI |
---|---|---|---|
Speichergröße | 48 GB GDDR6 | 24 GB GDDR6 | 64 GB GDDR6 (16 GB pro Grafikprozessor) |
GPU Architektur | NVIDIA Ampere | NVIDIA Ampere | NVIDIA Ampere |
Formfaktor | PCIe 4.0 dual slot | PCIe 4.0 single slot | PCIe 4.0 dual slot |
Power | 165W | 150W | 250W |
Virtualisierungs-Workload | Virtualisieren Sie Mainstream-Computing- und KI-Inferenz und unterstützen Sie bis zu 4 MIG-Instanzen. | Virtuelle Einstiegs- bis erweiterte Workstations für Design und Engineering mit NVIDIA vWS. Führen Sie auch grafikreiche virtuelle Desktops mit vPC und Deep-Learning-Inferenzen mit vCS aus. Upgradepfad für T4, RTX 6000. | Office-Produktivitätsanwendungen, Streaming-Tools für Video- und Telekonferenzen für grafikreiche virtuelle Desktops, auf die Sie von jedem Ort aus zugreifen können. Upgradepfad für M10. |
Thermal | passive | passive | passive |
vGPU-Softwareunterstützung | vCS | vWS, vPC, vApps, vCS | vWS, vPC, vApps, vCS |
GPU | V100 | RTX 8000 | T4 |
---|---|---|---|
Speichergröße | 32/16 GB HBM2 | 48 GB GDDR6 | 16 GB GDDR6 |
GPU Architektur | NVIDIA Volta | NVIDIA Turing | NVIDIA Turing |
Formfaktor | SXM4, and PCIe 4.0 dual slot | PCIe 3.0 dual slot | PCIe 3.0 single slot |
Power | 250/300W (SXM2) | 250W | 70W |
Virtualisierungs-Workload | Ultrahohes Rendering, Simulation und 3D-Design mit NVIDIA vWS. KI, Deep Learning und Datenwissenschaft mit NVIDIA vCS. | Arbeiten Sie mit NVIDIA vWS mit den größten und komplexesten RTX-fähigen Rendering-, 3D-Design- und Kreativanwendungen. | Virtuelle Workstations für 3D-Design und Engineering der Einstiegsstufe mit vWS. Führen Sie auch virtuelle Desktops mit vPC oder Deep Learning und Inferenzen mit vCS aus. |
Thermal | passive | passive | passive |
vGPU-Softwareunterstützung | vWS, vPC, vApp, vCS | vWS, vPC, vApps, vCS | vWS, vPC, vApps, vCS |
GPU | M10 | RTX 6000 | P6 |
---|---|---|---|
Speichergröße | 32 GB GDDR5 (8 GB per GPU) | 24 GB GDDR6 | 16 GB GDDR5 |
GPU Architektur | NVIDIA Maxwell | NVIDIA Turing | NVIDIA Pascal |
Formfaktor | PCIe 3.0 dual slot | PCIe 3.0 dual slot | MXM (blade servers) |
Power | 225W | 250W | 90 W (70 W opt) |
Virtualisierungs-Workload | Wissensarbeiter, die moderne Produktivitäts-Apps und Windows 10 verwenden. | Mit RTX-Anwendungen und NVIDIA vWS lassen sich erweiterte und hochwertige 3D-Designs und kreative Workflows entwickeln. | Virtuelle Workstations für 3D-Design und Engineering der Einstiegsstufe mit vWS. Führen Sie auch virtuelle Desktops mit vPC oder Deep Learning und Inferenzen mit vCS aus. |
Thermal | passive | passive | Bare Board |
vGPU-Softwareunterstützung | vWS, vPC, vApp | vWS, vPC, vApps, vCS | vWS, vPC, vApps, vCS |


Produktvorschau NVIDIA A16
Verbesserung der VDI-Benutzererfahrung
für Remote-Mitarbeiter
Wissensarbeiter verwenden mehrere Geräte und Monitore, um ihre Arbeit effizient zu erledigen. Sie benötigen außerdem einfachen Zugriff auf Produktivitäts-Tools und Anwendungen und müssen mit entfernten Teamkollegen zusammenarbeiten. Alles, von E-Mail und Webbrowsing bis hin zu Videokonferenzen und Streaming, kann von der GPU-Beschleunigung profitieren - und der NVIDIA A16 bietet diese starke Leistung, indem er die nächste Generation von VDI liefert.
Der A16 in Kombination mit der NVIDIA vPC Software ist ideal für die Bereitstellung von grafikintensiver VDI und einer verbesserten Benutzererfahrung für Wissensarbeiter. Sie bietet eine verbesserte Benutzerdichte gegenüber der Vorgängergeneration M10 mit bis zu 64 gleichzeitigen Benutzern pro Board und reduziert die Gesamtbetriebskosten um bis zu 20 Prozent.
Virtuelle Desktops, die von der NVIDIA vPC Software und dem A16 angetrieben werden, bieten ein Erlebnis, das von einem physischen PC nicht zu unterscheiden ist und Remote-Mitarbeitern einen nahtlosen Übergang zwischen der Arbeit im Büro und zu Hause ermöglicht.
Die GPU-beschleunigte VDI mit A16 und NVIDIA vPC bietet außerdem höhere Bildraten und geringere Latenzzeiten für den Endbenutzer, sodass Produktivitätsanwendungen und -tools schneller reagieren und Remote-Mitarbeiter ein optimales Benutzererlebnis erhalten.