Specifikationerna för NRELs Kestrel superdator som är designad av HPE har avslöjats och har upp till 44 PFLOPs med datorhästkrafter, kraftfull med Intels Sapphire Rapids Xeon, AMD EPYC Genoa CPU:er och NVIDIAs H100 GPU-acceleratorer.
AMD, Intel & NVIDIA Chips Power NREL Kestrel Supercomputer: AMD EPYC Genoa, Intel Sapphire Rapids & NVIDIA H100
US DOE:s National Renewable Energy Laboratory (NREL) tillkännagav sina planer förra året för Kestrel, en helt ny superdator som kommer att utnyttja den senaste tekniken från AMD, Intel & NVIDIA, för att ersätta deras befintliga Eagle superdator. Superdatorn kommer att designas av Hewlett Package Enterprise (HPE) och under en nyligen genomförd konferens avslöjade de den första titten på specifikationer för systemet.
Superdatorn Kestrel kommer att använda sig av standard- och accelererade noder. Den kommer att ha en toppprestanda på 44 PetaFlops, en ökning med 5,5 gånger jämfört med det befintliga Eagle-systemet. För standardnoderna kommer Kestrel att använda Intels senaste Sapphire Rapids ’Xeon Scalable’ processorer. Den speciella konfigurationen som används av Kestrel är en SKU med 52 kärnor och 104 trådar. Det kommer att finnas 2 304 standardnoder med varje nod som kör 2 processorer i en konfiguration med dubbla sockel. Det är totalt 4 608 Intel Sapphire Rapids-SP-processorer med totalt 239 616 kärnor och 479 232 trådar. Datalagring kommer att bestå av 75 PetaByers of Luster-lagring och var och en av de 2304 noderna kommer att konfigureras med 256 GB DDR5-minne för totalt 560 Petabyte systemminne.
Genom att flytta över till de accelererade noderna kommer Kestrel att distribuera 132 av dessa konfigurationer, var och en med fyra NVIDIA H100 GPU-acceleratorer baserade på Hopper-grafikarkitekturen och en AMD EPYC Genoa CPU-konfiguration med dubbla sockel. Det är 528 NVIDIA Hopper H100 GPU:er och 264 AMD EPYC Genoa-chips packade i dessa accelererade noder.
Vi vet inte de exakta konfigurationerna av vare sig NVIDIA H100 GPU eller AMD EPYC Genoa CPU:er som används inom Kestrel men om vi tar toppkonfigurationen får vi upp till 8 921 088 CUDA-kärnor (H100 SXM5) och totalt 25 344 Zen 4-kärnor ( EPYC Genoa upp till 92 kärnor). Accelerated-noden kommer också att ha 42 TB HBM3-minne och 20 TB systemminne. Det finns också 8 DAV-noder som inkluderar upp till 16 NVIDIA A40 GPU:er. Allt detta kommer att anslutas med hjälp av HPE Slighshot Dragonfly-interconnect. Några funktioner i HPE Slingshot interconnect inkluderar:
- Branschledande prestanda och skalbarhet
- 100GbE och 200GbE gränssnitt
- Hög radix, 64-portars, 12,8 Tb/s bandbreddsswitch
- Skalbarhet till >250 000 värdportar med maximalt 3 hopp
- Innovativ hantering av överbelastning av hårdvara, adaptiv routing och servicekvalitet
- Ethernet-standarder och -protokoll, plus optimerad HPC-funktionalitet
- Försök igen på länknivå och felkorrigering med låg latens framåt
- Standardiserade, öppna API-hanteringsgränssnitt
Kestrel-superdatorn är rankad att leverera 10,4 gflops/watt, vilket inte är i närheten av den nyligen tillkännagivna Frontier-superdatorn med över 50 gflops/watt effektivitet, men det är också dyrt och är ett större system än Exaflop-systemet. Superdatorn Kestrel förväntas vara utplacerad 2024.
Nyhetskälla: Momomo_US