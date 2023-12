Nieuwe 8-GPU systemen met AMD Instinct™ MI300X Accelerators zijn nu beschikbaar met baanbrekende AI- en HPC-prestaties voor grootschalige AI-, Training- en LLM-implementaties

SAN JOSE, Californië, 8 december 2023 /PRNewswire/ -- Supermicro, Inc. (NASDAQ: SMCI), een producent van Total IT oplossingen voor AI, Cloud, Opslag en 5G/Edge, kondigt drie toevoegingen aan voor de op AMD gebaseerde H13-generatie GPU-servers, geoptimaliseerd voor het leveren van toonaangevende prestaties en energie-efficiëntie, aangedreven door accelerators uit de nieuwe AMD MI300 serie. De krachtige rack-inbouw en schaalbare oplossingen van Supermicro met 8-GPU-servers met de AMD Instinct MI300X OAM-configuratie zijn ideaal voor grote modeltrainingen.

De nieuwe vloeistofgekoelde 2U en luchtgekoelde 4U servers met de AMD Instinct MI300A Accelerated Processing Units (APU's) accelerators zijn beschikbaar en verbeteren de efficiëntie van datacenters en voldoen aan de snel groeiende complexe eisen van AI, LLM en HPC. De nieuwe systemen bevatten quad-APU's voor schaalbare toepassingen. Supermicro kan complete vloeistofgekoelde rekken leveren voor grootschalige omgevingen met maximaal 1.728 TFlops aan FP64 geheugen per rack. De wereldwijde productiefaciliteiten van Supermicro stroomlijnen de levering van deze nieuwe servers voor convergentie van AI en HPC.

"We zijn erg enthousiast om onze Rack Scale Total IT Solutions voor AI training uit te breiden met de nieuwste generatie AMD Instinct accelerators, met tot 3,4X de prestatieverbetering in vergelijking met vorige generaties," zei Charles Liang, president en CEO van Supermicro. „Met onze mogelijkheid om 4.000 vloeistofgekoelde racks per maand te leveren vanuit onze wereldwijde productiefaciliteiten, kunnen we de nieuwste H13 GPU-oplossingen leveren met ofwel de AMD Instinct MI300X accelerator of de AMD Instinct MI300A APU. Onze beproefde architectuur maakt 1:1 400G-netwerken mogelijk voor elke GPU die is ontworpen voor grootschalige AI- en supercomputerclusters die volledig geïntegreerde vloeistofkoeloplossingen kunnen bieden. Dit geeft klanten een concurrentievoordeel op het gebied van prestaties en superieure efficiëntie met eenvoudige implementatie."

Het voor LLM geoptimaliseerde AS –8125GS-TNMR2 systeem is gebouwd op de architectuur van Supermicro, een beproefd ontwerp voor hoogwaardige AI-systemen met lucht- en vloeistofgekoelde schaalbare ontwerpen voor rackmontage. Het gebalanceerde systeemontwerp koppelt een GPU aan een 1:1-netwerk om een grote pool van geheugen met hoge bandbreedte over knooppunten en racks te bieden voor de grootste taalmodellen van vandaag met tot wel biljoenen parameters, waardoor parallel computergebruik wordt gemaximaliseerd en de leertijd en latency tot een minimum worden beperkt. Het 8U-systeem met de MI300X OAM-accelerator biedt de ruwe versnellingskracht van 8-GPU met de AMD Infinity Fabric™ Links, waardoor tot 896 GB/s theoretische P2P I/O-piekbandbreedte op het open standaardplatform met toonaangevende 1.5TB HBM3 GPU-geheugen in één systeem, naast ondersteuning voor native sparse matrix, ontworpen om energie te besparen en computercycli en het geheugengebruik voor AI-berekeningen te verminderen. Elke server beschikt over dual-socket AMD EPYC™ 9004-serie processoren met maximaal 256 kernen. Op rackschaal zijn meer dan 1000 CPU-kernen, 24 TB DDR5-geheugen, 6,144 TB HBM3-geheugen en 9728 rekeneenheden beschikbaar voor de meest veeleisende AI-omgevingen. Gebruik van de OCP Accelerator Module (OAM), waarmee Supermicro veel ervaring heeft wat betreft 8U-configuraties, brengt een volledig geconfigureerde server sneller op de markt dan een ontwerp op maat, waardoor de kosten en de levertijd afnemen.

Supermicro introduceert ook een voor compactheid geoptimaliseerde 2U vloeistofgekoelde server, de AS –2145GH-TNMR en een 4U luchtgekoelde server, de AS –4145GH-TNMR , elk met 4 AMD Instinct™ MI300A accelerators. De nieuwe servers zijn ontworpen voor HPC- en AI-toepassingen, die extreem snelle communicatie van CPU naar GPU vereisen. De APU elimineert redundante geheugenkopieën door de best presterende AMD CPU-, GPU- en HBM3-geheugen op één chip te combineren. Elke server bevat toonaangevende x86 „Zen4" CPU-kernen voor schaalvergroting van toepassingen. Bovendien bevat elke server 512 GB aan HBM3-geheugen. In een volledige rack-oplossing (48U) bestaande uit 21 2U-systemen is meer dan 10 TB aan HBM3-geheugen beschikbaar, evenals 19.152 rekeneenheden. De geheugenbandbreedte van HBM3 naar CPU is 5,3 TB/seconde.

Beide systemen beschikken over twee AIOM's met 400G Ethernet-ondersteuning en uitgebreide netwerkopties die zijn ontworpen om ruimte, schaalbaarheid en efficiëntie te verbeteren voor high-performance computing. Het 2U direct-to-chip vloeistofgekoelde systeem levert uitstekende TCO met een energiebesparing van meer dan 35%, gebaseerd op 21 2U-rackoplossingen die 61.780 watt per rack produceren in een luchtgekoeld rack van meer dan 95.256 watt, en een reductie van 70% in het aantal ventilatoren in vergelijking met een luchtgekoeld systeem.

„AMD Instinct MI300 Series accelerators leveren toonaangevende prestaties, zowel voor langdurige, versnelde computertoepassingen als voor de snel groeiende vraag naar generatieve AI", aldus Forrest Norrod, executive vice president en general manager van Data Center Solutions Business Group, AMD. „We blijven nauw samenwerken met Supermicro om toonaangevende AI- en HPC-totaaloplossingen op de markt te brengen op basis van MI300-serie accelerators en gebruikmakend van de expertise van Supermicro op het gebied van systeem- en datacenterontwerp."

