A Universidade de São Paulo (USP) inaugurou o cluster Jairu para o Centro de Inteligência Artificial e Aprendizado de Máquina (CIAAM-USP). O sistema é o maior em operação na América Latina com GPUs da arquitetura Blackwell B200, integrando 96 unidades de processamento gráfico e conectividade de alta velocidade para treinamento de modelos de IA avançados.
O cluster foi colocado em operação pela Scherm Brasil, com superservidores da linha Supermicro fornecidos pela Positivo Servers & Solutions, apoiando a tecnologia de processamento da NVIDIA. O investimento total foi de cerca de R$ 40 milhões, com a aquisição efetuada por importação direta dos Estados Unidos.
Arquitetura e interconexão: o Jairu contempla cinco head nodes para gerenciamento e orquestração; 12 nós de computação HGX, cada um com oito GPUs NVIDIA B200 SXM-5 conectadas via NVLink; armazenamento paralelo BeeGFS com aproximadamente 300 TB úteis; e rede de alta performance com Ethernet de até 200 Gb/s e InfiniBand NDR de até 800 Gb/s. Os head nodes usam servidores Supermicro com AMD EPYC e InfiniBand NDR 400 Gb/s.
A arquitetura de GPUs Blackwell B200, aliada à interconexão InfiniBand de até 800 Gb/s, oferece escalabilidade horizontal para treinamento distribuído de grandes modelos, incluindo LLMs e aplicações multimodais, bem como workloads de HPC aceleradas por GPU. A pilha de software inclui NVIDIA AI Enterprise e o NVIDIA Base Command Manager, que facilita o gerenciamento de workloads, filas e isolamento de usuários para reprodutibilidade de experimentos.
Segundo a NVIDIA, a arquitetura Blackwell foi desenhada para IA generativa e HPC, com foco em maior densidade computacional e eficiência energética. A montagem do equipamento foi concluída 30 dias após a assinatura do contrato. O Jairu representa, segundo a USP, o maior cluster em operação na região, fortalecendo a infraestrutura brasileira para treinamento de grandes modelos e pesquisas científicas orientadas por dados.