NVIDIA hävdar att Ampere A100 erbjuder upp till 2x högre prestanda och 2,8x effektivitet jämfört med AMD Instinct MI250 GPU:er

I en ny teknisk bloggNVIDIA har äntligen delat några siffror som jämför sin befintliga Ampere A100-accelerator med AMD Instinct MI250 GPU:er.

NVIDIA hävdar 2x högre prestanda och nästan 3x effektivitet för Ampere A100 GPU:er jämfört med AMD:s Instinct MI250

NVIDIA har redan tillkännagivit sin nästa generations H100 GPU baserad på Hopper-grafikarkitekturen (GPU) som kommer att skickas till kunder senare i år. Hopper GPU kommer att leverera en uppskattad 26x ökning i prestanda jämfört med Pascal P100 som släpptes för sex år sedan och det är 3x snabbare än den bana som Moores lag erbjuder.

Så när vi kom till prestandatesterna, testade NVIDIA Ampere A100 GPU i både enkel- och multi-GPU-konfigurationer. Samma konfigurationer användes för Instinct MI250 från AMD. Några av de mest populära datacenter-arbetsbelastningarna som LAMMPS, NAMD, openMM, GROMACS & AMBER användes för prestandatester.

NVIDIAs enda Ampere A100 GPU visade sig vara upp till 1,9x snabbare än AMD Instinct MI250 GPU-acceleratorn medan quad-GPU-lösningen visade upp till 2,1x förstärkning för Ampere-systemet. När det gäller energieffektivitet gav quad-GPU-lösningen 2,8x högre perf/watt.

Den utmärkta prestandan och energieffektiviteten hos NVIDIA A100 GPU är resultatet av många år av obeveklig samoptimering av mjukvara och hårdvara för att maximera applikationsprestanda och effektivitet. För mer information om NVIDIA Ampere-arkitekturen, se NVIDIA A100 Tensor Core GPU vitt papper.

A100 presenteras också som en enda processor för operativsystemet, vilket kräver att endast en MPI-rankning lanseras för att dra full nytta av dess prestanda. Och A100 levererar utmärkt prestanda i skala tack vare 600-GB/s NVLink-anslutningar mellan alla GPU:er i en nod.

Följande är anteckningarna från testet:

Effektivitetsförhållande på A100 till MI250 visas – högre är bättre för NVIDIA. Geomisk över flera datamängder (varierar) per applikation. Effektivitet är prestanda/strömförbrukning (watt) mätt för GPU:erna med mätt med NVIDIA SMI och motsvarande funktionalitet i ROCm |

AMD MI250 uppmätt på en GIGABYTE M262-HD5-00 med (2) AMD EPYC 7763 med 4x AMD Instinct™ MI250 OAM (128 GB HBM2e) 500W GPU:er med AMD Infinity Fabric™-teknik. NVIDIA körs på ProLiant XL645d Gen10 Plus med dubbla EPYC 7713-processorer och 4x A100 (80 GB) SXM4

LAMMPS develop_db00b49(AMD) develop_2a35ec2(NVIDIA) dataset ReaxFF/c, Tersoff, Leonard-Jones, SNAP | NAMD 3.0alpha9 dataset STMV_NVE | OpenMM 7.7.0 Ensemble körs för datauppsättningar: amber20-stmv, amber20-cellulosa, apoa1pme, pme|

GROMACS 2021.1(AMD) 2022(NVIDIA) dataset ADH-Dodec (h-bond), STMV (h-bond) | AMBER 20.xx_rocm_mr_202108(AMD) och 20.12-AT_21.12 (NVIDIA) datauppsättningar Cellulose_NVE, STMV_NVE | 1x MI250 har 2x GCD

via NVIDIA

Nu bör det noteras att AMD Instinct MI250 som används här inte är den fullständiga konfigurationen eftersom den sitter på MI250X, men baserat på dessa resultat bör A100 fortfarande vara mycket konkurrenskraftig mot AMD CDNA 2-erbjudandena. Med Hopper som kommer snart kommer NVIDIA att driva dessa siffror ytterligare och det är där AMD:s Instinct MI300 kommer in med sin helt nya APU-liknande design.