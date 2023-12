Novos sistemas de 8 GPU equipados com aceleradores AMD Instinct™ MI300X agora estão disponíveis com IA inovadora e desempenho de HPC para treinamento de IA em larga escala e implantações de LLM

SAN JOSE, Califórnia, 8 de dezembro de 2023 /PRNewswire/ -- A Supermicro, Inc. (NASDAQ: SMCI), fabricante de soluções completas de TI para IA, nuvem, armazenamento e 5G/Edge, está anunciando três novas adições à sua geração H13 de servidores de GPU baseados em AMD, otimizados para oferecer desempenho e eficiência de ponta, equipados com os novos aceleradores da série AMD Instinct MI300. As poderosas soluções de rack em escala da Supermicro com servidores de 8 GPUs com a configuração AMD Instinct MI300X OAM são ideais para o treinamento de grandes modelos.

A Supermicro amplia as soluções de IA e GPU de rack em escala com suporte para os aceleradores

Os novos servidores 2U arrefecidos a líquido e 4U arrefecidos a ar com os aceleradores de Unidades de Processamento Acelerado (APUs) AMD Instinct MI300A estão disponíveis e melhoram a eficiência do data center e alimentam as demandas complexas de rápido crescimento em IA, LLM e HPC. Os novos sistemas contêm APUs quádruplas para aplicações escaláveis. A Supermicro pode fornecer racks completos com refrigeração líquida para ambientes de grande escala com até 1.728 TFlops de desempenho FP64 por rack. As instalações de fabricação da Supermicro do mundo inteiro agilizam a entrega desses novos servidores para a convergência de IA e HPC.

"Estamos muito entusiasmados em expandir nossas Soluções Totais de TI de rack em escala para treinamento de IA com a última geração de aceleradores AMD Instinct, com até 3,4 vezes a melhoria de desempenho em comparação com as gerações anteriores", disse Charles Liang, presidente e CEO da Supermicro. "Com nossa capacidade de fornecer 4.000 racks com arrefecimento líquido por mês a partir de nossas instalações de fabricação no mundo inteiro, podemos fornecer as mais novas soluções de GPU H13 com o acelerador AMD Instinct MI300X ou a APU AMD Instinct MI300A. Nossa arquitetura comprovada permite uma rede 1:1 400G dedicada para cada GPU projetada para clusters de IA e supercomputação em grande escala, capaz de soluções de arrefecimento líquido totalmente integradas, oferecendo aos clientes uma vantagem competitiva em termos de desempenho e eficiência superior com facilidade de implantação."

Saiba mais sobre os servidores Supermicro com aceleradores AMD

O sistema AS –8125GS-TNMR2 otimizado para LLM foi desenvolvido com base na arquitetura de blocos de construção da Supermicro, um design comprovado para sistemas de IA de alto desempenho com designs de rack em escala com arrefecimento a ar e a líquido. O design equilibrado do sistema associa uma GPU a uma rede 1:1 para fornecer um grande pool de memória de alta largura de banda entre nós e racks para se adequar aos maiores modelos de linguagem atuais com até trilhões de parâmetros, maximizando a computação paralela e minimizando o tempo de treinamento e a latência de inferência. O sistema 8U com o acelerador MI300X OAM oferece a potência bruta de aceleração de 8 GPUs com os links AMD Infinity Fabric™, permitindo até 896 GB/s de largura de banda de E/S P2P teórica de pico na plataforma de padrão aberto com memória de GPU HBM3 de 1,5 TB líder do setor em um único sistema, como também suporte nativo a matrizes esparsas, projetado para economizar energia, diminuir os ciclos de computação e reduzir o uso de memória para cargas de trabalho de IA. Cada servidor apresenta processadores AMD EPYC™ série 9004 de soquete duplo com até 256 núcleos. Em rack em escala, mais de 1000 núcleos de CPU, 24 TB de memória DDR5, 6,144 TB de memória HBM3 e 9728 unidades de computação estão disponíveis para os ambientes de IA mais desafiadores. O uso do Módulo Acelerador OCP (OAM), com o qual a Supermicro tem experiência significativa em configurações de 8U, leva um servidor totalmente configurado ao mercado mais rápido do que um design personalizado, reduzindo custos e tempo de entrega.

A Supermicro também está lançando um servidor 2U arrefecido a líquido com densidade otimizada, o AS -2145GH-TNMR, e um servidor 4U arrefecido a ar, o AS -4145GH-TNMR, cada um com 4 aceleradores AMD Instinct™ MI300A. Os novos servidores foram projetados para aplicações HPC e IA, que exigem uma comunicação extremamente rápida entre CPU e GPU. A APU elimina cópias redundantes de memória ao combinar a CPU, a GPU e a memória HBM3 da AMD de mais alto desempenho em um único chip. Cada servidor contém núcleos de CPU x86 "Zen4" de liderança para escalonamento de aplicações. Além disso, cada servidor inclui 512 GB de memória HBM3. Em uma solução de rack completo (48U) que consiste em 21 sistemas 2U, mais de 10 TB de memória HBM3 estão disponíveis, como também 19.152 unidades de computação. A largura de banda da memória HBM3 para CPU é de 5,3 TB/segundo.

Ambos os sistemas apresentam AIOMs duplos com suporte a Ethernet 400G e opções de rede expandidas projetadas para melhorar o espaço, a escalabilidade e a eficiência da computação de alto desempenho. O sistema 2U com resfriamento líquido direto ao chip oferece excelente TCO com mais de 35% de economia no consumo de energia com base em 21 soluções de rack de sistema 2U que produzem 61.780 watts por rack em relação a 95.256 watts de rack arrefecido a ar, como também uma redução de 70% no número de ventiladores em comparação com um sistema arrefecido a ar.

"Os aceleradores da série AMD Instinct MI300 oferecem desempenho de liderança, tanto para aplicativos de computação de alto desempenho acelerados de longa data quanto para a crescente demanda por IA generativa", disse Forrest Norrod, vice-presidente executivo e gerente geral do Data Center Solutions Business Group da AMD. "Continuamos trabalhando em estreita colaboração com a Supermicro para trazer ao mercado soluções totais de IA e HPC de ponta com base nos aceleradores da série MI300 e aproveitando a experiência da Supermicro em design de sistema e data center."

