SAN JOSE, Califórnia, 9 de outubro de 2024 /PRNewswire/ -- A Super Micro Computer, Inc. (SMCI), fornecedora de soluções totais de TI para IA, nuvem, armazenamento e 5G/Borda, anuncia o lançamento de uma nova plataforma de infraestrutura versátil e de alta densidade otimizada para inferência de IA na borda da rede. À medida que as empresas buscam adotar grandes modelos de linguagem (LLM) complexos em suas operações diárias, existe a necessidade de um novo hardware com capacidade de inferir grandes volumes de dados em locais de borda com latência mínima. O inovador sistema da Supermicro combina versatilidade, desempenho e eficiência térmica para entregar até 10 GPUs de largura dupla em um único sistema capaz de funcionar em ambientes tradicionais refrigerados a ar.

Sistema de inferências de IA EDGE 3U com suporte para 8 placas aceleradoras de GPU de largura dupla SYS-322GB-NR em perspectiva Parte traseira do SYS-322GB-NR

"Devido ao design térmico otimizado do sistema, a Supermicro consegue entregar todo esse desempenho em um sistema 3U 20 PCIe de alta densidade com 256 núcleos e que pode ser implantado em data centers de ponta", disse Charles Liang, presidente e CEO da Supermicro. "Como o mercado de IA está crescendo exponencialmente, os clientes precisam de uma solução poderosa e versátil para dados gerados por inferência para executar aplicativos baseados em LLM no local, perto de onde os dados são gerados. Nosso novo sistema 3U Edge AI permite a execução de soluções inovadoras com latência mínima."

Para obter mais informações, acesse https://www.supermicro.com/en/solutions/edge-ai

O novo SYS-322GB-NR contém dois potentes processadores Intel® Xeon® 6900 com núcleos P, MRDIMM de 8800 MT/s e até 20 slots de expansão PCIe 5.0. Esse sistema da Supermicro é compatível com uma série de GPUs de largura simples ou dupla, ou com o uso de alguns dos slots de expansão para E/S de alto desempenho ou outras placas complementares. Além disso, o servidor possui até 6 TB de memória RDIMM e até 14unidades NVMe E1.S ou 6 unidades NVMe U.2.

Um exemplo de uso que esse sistema oferece é na indústria de transformação, onde o novo sistema da Supermicro pode ser implantado no local em um ambiente de produção automatizado para processar feeds de dados provenientes de câmeras e sensores sem a necessidade de transferir os dados para um local remoto. Esse recurso diminui os requisitos de rede e melhora os tempos de resposta. Outro ambiente em que o SYS-322GB-NR se destacará são as salas de controle de grande porte, onde as placas aceleradoras de IA podem ser parcialmente substituídas por placas com vários monitores para comportar até 64 monitores independentes.

Supermicro no Mobile World Congress (MWC) em Las Vegas

O SYS-322GB-NR estará em exibição no estande nº 518 da Supermicro durante o MWC Las Vegas, de 8 a 10 de outubro. Ao mesmo tempo, a Supermicro exibirá sistemas que incorporam processadores NVIDIA, AMD e Intel Xeon 6, inclusive sistemas de ponta e de telecomunicações da família X14, como:

SYS-222HE-FTN - o Hyper-E leva o desempenho do data center para a borda de telecomunicações com um processador Intel Xeon 6 duplo em um formato 2U short-depth com acesso de E/S frontal

SYS-212B-FN2T - um sistema 2U short-depth para IA em instalações de telecomunicações e de borda, com um único processador Intel Xeon série 6700 com E-cores (efficient cores) e suporte a GPU

SYS-E403-14B-FRN2T- um dispositivo de borda montável na parede, do tamanho de um PC de mesa, capaz de levar o processador Intel Xeon série 6700 com E-cores e suporte a GPU para ambientes remotos

AS -1115S-FDWTRT - um sistema compatível com 1U NEBS que oferece desempenho de telecomunicações para serviços ORAN, Core e gerenciados. Esse sistema utiliza o processador AMD EPYC série 8004 e suporta até 1 acelerador de GPU de largura única para cargas de trabalho pesadas.

Além de exibir os sistemas de hardware da Supermicro, em parceria com a NVIDIA, demonstraremos em conjunto soluções de inferência e IA para aplicativos locais e de borda, incluindo IA corporativa, varejo, telecomunicações de borda e serviços financeiros. Demonstraremos as principais soluções de IA generativa que incluem NVIDIA NIM, NVIDIA NeMo, NVIDIA Metropolis, gerenciamento remoto, segurança e rede. Para Telecom, a Supermicro e a NVIDIA demonstrarão uma solução AI RAN ao vivo que utiliza soluções NVIDIA e Supermicro, apresentando exemplos de desempenho, gerenciamento e uso de IA.

Além disso, será exibida no MWC Las Vegas a nova solução conjunta da Supermicro e da Intel, que combina o sistema robusto IP65 Outdoor Edge com um acelerador de rede de IA integrado e a GPU Flex 170 do Intel® Data Center. Esta solução permite a instalação rápida e econômica de várias redes 5G privadas, bem como aplicativos de IA de borda em um único dispositivo. As redes podem ser usadas e exploradas por diferentes usuários, oferecendo uma solução dimensionável para ambientes densos, como instalações industriais e universidades, locais de eventos e cidades inteligentes.

