O processador Vera da NVIDIA para data centers só chegará ao mercado no final deste ano, mas recentemente tive a oportunidade de testar essa nova CPU baseada em ARM, projetada para cargas de trabalho de IA com agentes. O processador Vera da NVIDIA, com seus núcleos Olympus desenvolvidos internamente, oferece um desempenho impressionante, com uma competitividade com CPUs Intel/AMD x86_64 que eu nunca vi em nenhum outro processador ARM ou não-x86_64. Continue lendo para conferir os primeiros benchmarks do processador Vera da NVIDIA no Linux.
Vera é a CPU de data center de última geração da NVIDIA, projetada para IA ativa e cargas de trabalho semelhantes em data centers modernos. A Vera será encontrada principalmente com o NVIDIA NVL72 Vera Rubin como CPU host para alimentar esses racks de IA de alto desempenho, além de estar disponível como unidade independente para racks de CPU. Ao contrário do NVIDIA Grace, que usa núcleos Arm Neoverse-V2, a Vera utiliza o design de núcleo "Olympus" da NVIDIA.
A Vera apresenta 88 núcleos Olympus que prometem o dobro do desempenho de sua antecessora, além de eficiência energética líder de mercado. Os núcleos Olympus são compatíveis com a arquitetura Armv9.2 e suportam precisão FP8, totalizando 176 threads via multithreading espacial, e são combinados com memória LPDDR5X para oferecer até 1,2 TB/s de largura de banda. Em comparação com a Grace, a Vera também possui o dobro de cache L2, com 2 MB por núcleo, um cache L3 unificado maior, com 164 MB, e suporte para PCIe Gen 6 e conectividade CXL 3.1.
O processador Vera testado neste benchmark inicial apresentou um TDP máximo de 450 watts no soquete. Com a memória LPDDR5X, o consumo de energia fica em torno de 50 watts ou menos.
Os processadores NVIDIA Vera para data centers continuam com previsão de lançamento para o segundo semestre do ano, mas antes do aumento da produção, a NVIDIA me convidou para sua sede em Santa Clara para executar alguns dos primeiros benchmarks públicos deste novo processador com seus núcleos Olympus. Este artigo apresenta esses resultados iniciais. Mas antes de falar sobre desempenho, é importante observar o nível de suporte ao Linux. Como o Vera ainda não foi lançado oficialmente, eu realmente não sabia o que esperar em relação ao suporte do kernel Linux upstream e afins, ou quais eram os planos da NVIDIA para as principais distribuições Linux ARM64, etc. Felizmente, o NVIDIA Vera já conta com um bom suporte do kernel Linux upstream. O Linux 7.1+ possui suporte para os principais drivers e o Vera deve funcionar em distribuições Linux para servidores ARM64, como Ubuntu, Fedora, etc. A NVIDIA também continuará a fornecer o sistema operacional base como sua versão modificada do Ubuntu com todos os patches do Vera prontos. O ACPI é utilizado e não há necessidade de lidar com árvores de dispositivos complexas ou outras dores de cabeça para o NVIDIA Vera no Linux.
Como o Vera é compatível com Armv9.2 e está em conformidade com a Arquitetura de Sistema Base de Servidor (SBSA) da Arm, ele acaba utilizando muitos dos drivers Linux ARM comuns para suporte, o que explica, em parte, a maior dificuldade em rastrear o status de suporte do kernel upstream antes do lançamento, em função da disponibilidade do hardware. Entre os códigos Linux ARM comuns utilizados está o trabalho em andamento em torno do Arm Confidential Compute (CCA) para computação confidencial com máquinas virtuais, que será suportado pelo Vera.
No ano passado, o GCC e o LLVM Clang adicionaram suporte aos núcleos Olympus . Isso significa que é necessário o GCC 16.1+ ou o LLVM Clang 21+ para compilar binários otimizados para Vera. Foi uma iniciativa excelente e ambiciosa da NVIDIA introduzir esse suporte ao compilador Olympus tão cedo, e eles merecem aplausos por isso. Para efeito de comparação, embora a NVIDIA tenha integrado o suporte ao Olympus ao GCC em março de 2025, o suporte ao AMD Zen 6 (znver6) só foi adicionado ao GCC em dezembro e, em fevereiro deste ano, ao LLVM/Clang. A integração do suporte ao compilador Olympus pela NVIDIA é semelhante ao suporte antecipado que estamos acostumados a ver da Intel ao longo dos anos. É ótimo ver a NVIDIA tomar uma iniciativa semelhante com a integração do Vera aos compiladores e, de forma geral, ao GCC. Esperamos que isso continue com as futuras gerações de CPUs da NVIDIA.
Não consegui testar o carregamento de diferentes distribuições Linux no NVIDIA Vera ou similares, mas, pelo que me disseram enquanto trabalhava na NVIDIA, o suporte upstream para Linux de código aberto já está bem robusto para o Vera. Meus testes foram realizados no Ubuntu 24.04 LTS com a configuração base do sistema operacional, que consiste em um kernel Linux 6.18 LTS com patches e o GCC 16.1.
A NVIDIA Vera, com seus núcleos Olympus, funcionou bem no Linux. Uma ressalva é que alguns ajustes de gerenciamento de energia ainda estão sendo implementados no código principal. Recentemente, mencionei o trabalho da NVIDIA no suporte a ACPI CPPC v4 para Linux, e este parece ser um dos aspectos relacionados. Devido a esses ajustes de gerenciamento de energia ainda em andamento, infelizmente, a NVIDIA solicitou que o monitoramento do consumo de energia da CPU não fosse ativado durante esta rodada inicial de benchmarks. Da mesma forma, o monitoramento da frequência da CPU também não foi permitido durante esta primeira rodada de testes. Além disso, os benchmarks da NVIDIA Vera foram realizados em um de seus sistemas de pré-produção de plataforma aberta, enquanto que serão mais relevantes para a análise de consumo de energia e frequência em um servidor de produção real, com chassis fechados, previsto para o final de 2026.
A NVIDIA também solicitou que fossem testados apenas os workloads específicos relevantes para os domínios/loadloads pretendidos para os quais o Vera se destina em data centers. Portanto, esta primeira rodada de benchmarks do Vera não é muito abrangente em todo o espectro de workloads possíveis, mas limitada aos benchmarks permitidos com base no que eles consideram mais relevante — além do fato de eu ter passado apenas um dia nos escritórios da NVIDIA. Para esses benchmarks iniciais do NVIDIA Vera, eles preferiram que o escopo dos benchmarks fosse limitado aos casos de uso que consideram mais relevantes para seus clientes de data centers modernos. Este não é um artigo patrocinado, mas atendi aos pedidos deles para executar esses benchmarks iniciais da CPU Vera. Espero que, nas próximas rodadas de testes do Vera nos próximos meses, haja um conjunto mais abrangente de benchmarks para aqueles curiosos sobre o desempenho geral do núcleo da CPU Olympus. Da mesma forma, espero poder relatar a eficiência energética e o desempenho por watt assim que o código de gerenciamento de energia for otimizado.
Fonte: phoronix
Nenhum comentário:
Postar um comentário