A aparição da NVIDIA no Hot Chips 2025 no segmento de gráficos teve menos a ver com o novo silício e mais com uma mudança de ênfase. O Blackwell está sendo apresentado como uma plataforma que torna o aprendizado de máquina uma parte natural da renderização, em vez de um complemento. A empresa mostrou como a arquitetura se estende de grandes placas de data center até GPUs de laptop e explicou por que essa gama importa. Em vez de depender do trabalho de raster de força bruta, o foco está em abordagens neurais, como redução de ruído e geração de quadros aprendidos, que podem reproduzir ou aprimorar pixels a um custo muito menor. Para dar suporte a essa mudança, a NVIDIA está migrando para a matemática FP4 para reduzir a memória e os consumos de computação, e investiu em melhorias no escalonador, como reordenação de execução de shaders e trabalho pesado com inteiros para que multiprocessadores de streaming permaneçam ocupados. A palestra também mostrou um processador de gerenciamento de IA no chip que coordena dados e prioridades para que shaders gráficos e kernels de inferência não bloqueiem um ao outro.
A estrutura prática por trás desses conceitos foi tão importante quanto os modelos. O suporte a GDDR7 da Blackwell oferece maior largura de banda utilizável em tensões mais baixas, o que auxilia tanto em passagens de renderização tradicionais quanto em grandes trabalhos de tensor. A NVIDIA descreveu técnicas para reduzir o tempo até o primeiro token em cargas de trabalho mistas, permitindo que agentes e gráficos interativos atendam a diferentes necessidades de latência. A empresa promoveu a ideia de uma "corrida para ocioso", em que um sistema usa interpolação aprendida ou inferência seletiva no lugar de uma renderização completa para economizar energia. Por fim, recursos emprestados do mundo dos data centers, como o Universal MIG, permitem que uma única GPU seja dividida em várias GPUs virtuais menores, melhorando a utilização para clientes leves e gerando ganhos consideráveis em relação ao simples fatiamento de tempo. A mensagem final foi clara: a Blackwell não se trata apenas de adicionar TeraFLOPS. Trata-se de repensar o agendamento e combinar ML com gráficos para tornar práticas experiências eficientes e em tempo real. A renderização neural é para onde o mundo gráfico está se dirigindo, e a NVIDIA quer acelerar todas as etapas do pipeline.
Fonte: techpowerup
Nenhum comentário:
Postar um comentário