A AMD revelou oficialmente suas GPUs RX 9070 e RX 9070 XT baseadas em RDNA 4


A AMD finalmente revelou suas tão esperadas placas de vídeo RDNA 4, a RX 9070 e a RX 9070 XT. E, para ser honesto, parece que demorou muito para chegar. Os detalhes têm sido escassos após uma meia-revelação um tanto caótica durante a CES 2025 , mas agora finalmente recebemos detalhes concretos sobre do que essas placas são feitas — e uma olhada mais de perto na nova arquitetura brilhante por dentro.

Bem, meio brilhante e novo, pelo menos. Provavelmente é mais fácil pensar no RDNA 4 como uma evolução do RDNA 3 do que um salto quântico na arquitetura de GPU da AMD, e isso talvez não seja uma coisa ruim. A AMD confirmou mais uma vez que o lançamento está marcado para 6 de março, e acaba de confirmar que a RX 9070 custará US$ 549, e a RX 9070 XT custará US$ 599.

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

Embora a AMD tenha feito questão de ressaltar que essas placas não foram projetadas para competir no topo do mercado , o preço aqui é surpreendentemente competitivo para placas modernas de médio porte, principalmente se elas forem tão performáticas quanto a AMD diz. De qualquer forma, vamos ao show.

Tanto a RX 9070 quanto a RX 9070 XT são construídas no nó de processo de 4 nm da TSMC, resultando em um die de 357 mm² aproximadamente do mesmo tamanho da versão usada na RX 7800 XT , mas com quase o dobro de transistores: 53,9 bilhões no total. No entanto, mesmo com a contagem de transistores massivamente aumentada, não há nada que pareça particularmente fora do comum na visão arquitetônica geral do die em si — mas é quando você mergulha nos detalhes das Unidades de Computação que as coisas se tornam interessantes.

As CUs do RDNA 4 inicialmente parecem muito com as versões do RDNA 3, com algumas eficiências importantes jogadas no pote. No entanto, sentado ao lado de cada lote de ALUs e TLUs está agora um acelerador de IA de segunda geração com suporte para cálculos FP8 e operações de matriz aprimoradas, juntamente com um subsistema de memória mais rápido, unidades escalares aprimoradas e alocação dinâmica de registro, o que a AMD diz que tudo leva a uma maior eficiência por CU e velocidades de clock muito mais altas em comparação com o RDNA 3.

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

O RDNA 4 também suporta a reordenação de instruções de shader que solicitam memória, o que deve manter essas novas CUs ocupadas.

Fique de olho nesses aceleradores de IA. Eles entrarão em ação mais tarde para a versão mais recente do upscaler da AMD, FSR 4, mas estou me precipitando. Voltando para as coisas mais simples e sujas.

As CUs ainda são pareadas em Dual Compute Units, conforme RDNA 3. A RX 9070 XT obtém oito por mecanismo de shader, com um total geral de 256 ALUs, 32 TLUs, quatro aceleradores de IA e cache escalar de 16 KB entre eles, juntamente com 32 KB de cache de instruções de shader e 128 KB de memória compartilhada por mecanismo de computação. Sentado na ponta final da nossa linda pilha de CUs, obtemos dois aceleradores de raios cada, e são as mudanças aqui das quais a AMD parece particularmente orgulhosa.

As placas RDNA 3 não eram conhecidas por seu desempenho de traçado de raios, e a AMD parece ter se concentrado nesse déficit para trazer um aumento de desempenho de travessia de raios 2x para a RDNA 4. Os aceleradores de traçado de raios de terceira geração usam "Caixas Delimitadoras Orientadas" para reduzir o tamanho e a complexidade dos dados da Hierarquia de Volume Delimitador, o que, segundo ela, oferece uma travessia de raios muito mais eficiente por meio da geometria com um custo de memória menor, fazendo melhor uso da VRAM no processo.

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

Os novos aceleradores RT agora têm um segundo mecanismo de interseção, que, segundo a AMD, dobra o desempenho para testes de Ray/Box e Ray/Triangle, juntamente com um bloco de transformação de raios dedicado, que também aumenta o desempenho à medida que os raios são atravessados.

Embora a AMD ainda esteja realizando a travessia dos dados BVH por meio de CUs em vez de um ASIC dedicado, cada acelerador RT é mais robusto do que as versões anteriores, o que esperamos que se traduza em um desempenho de rastreamento de raios que tenha uma chance de competir com os esforços da Nvidia.

Como resultado de todo esse reforço de CU, as novas GPUs são reivindicadas para entregar números de desempenho comparáveis ​​aos cartões de ponta da série RX 7900, apesar de terem uma contagem total de CU menor no geral. A RX 9070 XT tem 64 CUs atualizados no total e a RX 9070 se contenta com 56 — em comparação com as 84 unidades de computação que você encontraria na RX 7900 XT , por exemplo.

Isso significa que a RX 9070 XT acaba com 64 aceleradores de raio, 128 aceleradores de IA e 4096 processadores de fluxo, em comparação com os 56 aceleradores de raio, 112 aceleradores de IA e 3584 processadores de fluxo do padrão RX 9070. As velocidades de clock também são muito menores para a RX 9070 em comparação com sua irmã maior, com a placa padrão atingindo um clock de boost de até 2.520 MHz em comparação com o pico de 2.970 MHz da RX 9070 XT.


Parte de mim acha que os 70 MHz no final do clock de boost do XT são puramente por razões de marca (afinal, é a série RX 9070), mas eu ficaria curioso para ver que tipo de potencial de overclocking é deixado na mesa aqui. As GPUs da série RTX 50 da Nvidia têm sido overclockers confiáveis ​​até agora e, considerando todos os movimentos em direção à eficiência do CU com o RDNA 4, parte de mim se pergunta se pode haver mais para dar nas placas AMD também. Descobriremos no devido tempo, eu acho.

Olhando para a arquitetura geral, é uma imagem razoavelmente semelhante ao que você encontraria no RDNA 3. A AMD diz que "otimizou e equilibrou" o sistema de cache, com 64 MB de Infinity Cache de terceira geração, 8 MB de cache L2 (uma melhoria de 2 MB em relação aos 6 MB do RDNA 3) e 2 MB de cache CU agregado disponível, governado por um processador de comando aprimorado.

(Crédito da imagem: AMD)

Ambas as novas placas farão uso de 16 GB de GDDR6 20 Gbps VRAM cada, em um barramento de 256 bits com uma largura de banda de memória efetiva de 640 GB/s. Elas também apresentam um mecanismo de mídia aprimorado para melhor qualidade de codificação, suportando streaming de até 8K/60 fps e gravação via AV1.

Quando se trata de uso de energia, a AMD diz que a RX 9070 XT tem um TBP de 304 W com uma potência de PSU recomendada de 750 W, enquanto a RX 9070 tem apenas 220 W TBP com uma recomendação de fonte de alimentação de 650 W. Esses são alguns números de energia impressionantemente baixos, principalmente considerando as alegações de desempenho.

Desempenho

Falando nisso, os gráficos de desempenho da AMD colocam a RX 9070 XT contra a RX 7900 GRE . Essa é uma placa de gama média alta da geração RDNA 3, o que dá algumas pistas sobre onde a AMD acha que a RX 9070 XT se encaixa na pilha em comparação com seus modelos anteriores.

É alegado que a RX 9070 XT oferece entre 23% e 48% mais desempenho do que a RX 7900 GRE em configurações nativas Ultra 4K em uma variedade de jogos, com Cyberpunk 2077 ganhando mais quadros. A comparação de desempenho de ray tracing 4K Ultra, no entanto, mostra que o F1 24 ganha 66% mais desempenho no F1 24 junto com o Cyberpunk em comparação com a placa mais antiga, sugerindo que essas melhorias arquitetônicas de ray tracing realmente podem se traduzir em ganhos significativos no mundo real.

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

Ainda assim, é sempre melhor tratar números como esses como indicadores, em vez de dados frios e concretos. Não é nenhuma surpresa que a RX 9070 XT mostrasse melhorias significativas no ray tracing em relação à RX 7900 GRE, já que, para ser honesto, essa placa nunca foi muito boa com os recursos de ray tracing habilitados.

E a AMD, como qualquer fabricante, sempre vai apresentar os dados que mostram suas GPUs no seu melhor. Colocaremos a RX 9070 e a RX 9070 XT à prova em breve em nossos próprios testes independentes, e é aí que teremos uma ideia melhor do desempenho exato das novas placas.

FSR 4

E eu nem mencionei o FSR 4. As placas da série RTX 50 da Nvidia dependem muito do DLSS 4 para ganhos massivos de desempenho, e a AMD frequentemente se sente muito atrás da curva com sua solução de upscaling concorrente, o FSR. Anteriormente, o FSR era um upscaler baseado em computação, mas a nova versão finalmente joga o aprendizado de máquina na mistura graças aos novos aceleradores de IA nas placas RDNA 4.

(Crédito da imagem: AMD)

Os cálculos de matriz nas placas RDNA de 3ª geração foram manipulados por uma arquitetura não dedicada nas CUs, enquanto as unidades de matriz aceleradora de IA dedicadas instaladas na série RX 9070 finalmente trouxeram o FSR para o reino do aprendizado de máquina.

Então sim, isso significa que o FSR 4 depende da série RX 9070, e usuários mais antigos de placas AMD (como eu) não conseguem jogar. Ainda assim, os modelos de aprendizado de máquina foram treinados no hardware EPYC e Instinct AI da AMD, e a qualidade de imagem reivindicada e os aumentos de desempenho obtidos como resultado parecem impressionantes nas capturas de tela até agora.

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

(Crédito da imagem: AMD)

Olhando para a primeira imagem acima, fica claro onde o FSR 3.1 falha em termos de qualidade de imagem. Os topos das torres à distância mostram artefatos consideráveis ​​e pixels faltando, enquanto o FSR 4 parece fazer um trabalho muito melhor em preservar dados de imagem nativos, mesmo em configurações de Performance.

A AMD também está reivindicando um aumento de 3,5x no desempenho em Space Marine 2 em 4K com FSR 4 e geração de quadros habilitada, com ganhos significativos na taxa de quadros relatados em Call of Duty: Black Ops 6, Ratchet and Clank e Marvel's Spider-Man: Miles Morales, entre outros.

A AMD diz que haverá mais de 30 jogos suportados no lançamento, com mais de 75 chegando em 2025 de uma variedade de desenvolvedores. Dedos cruzados para que isso não seja como o FSR 3.1, que ainda sofre de suporte limitado em muitas versões modernas, embora o FSR 4 aparentemente seja uma atualização drop in para jogos usando a API FSR 3.1.

(Crédito da imagem: AMD)

Há também uma nova versão do AMD Fluid Motion Frames no mercado, o AFMF 2.1. Ele alega oferecer qualidade de imagem de geração de quadros aprimorada com redução de fantasmas e melhor rastreamento temporal, e será suportado por placas AMD RX séries 6000, 7000 e 9070, juntamente com a iGPU em processadores Ryzen AI série 300.

Então, há muito o que ficar animado aqui, especialmente o preço. Muitos presumiram que a AMD miraria em um ponto de preço de US$ 699 para a RX 9070 XT, mas US$ 599? Isso parece totalmente razoável se as alegações de desempenho forem comprovadas.

(Crédito da imagem: AMD)

A AMD também afirma "ampla disponibilidade" a partir de 6 de março, de AIBs como Acer, ASRock, Asus , Gigabyte, Sapphire e mais, fornecendo números abundantes das novas placas. Se isso se provará na prática ainda não se sabe, mas dado que é extremamente difícil obter uma placa RTX série 50 agora em qualquer lugar próximo ao seu MSRP, isso potencialmente é um bom presságio para as vendas se os estoques realmente forem tão abundantes quanto a AMD diz.

Então, depois de meses de especulação, finalmente temos alguma competição de GPU AMD a caminho. Embora o RDNA 4 não pareça uma mudança radical quando comparado ao RDNA 3, as principais melhorias na aceleração de ray tracing e melhorias de IA podem ser exatamente o que o médico receitou, e estarei ansioso para ver o que essas melhorias se traduzem em desempenho no mundo real quando as testarmos por nós mesmos.

Vamos lá 6 de março, é o que eu digo. A batalha das placas de vídeo começa mais uma vez.

Fonte: pcgamer

Nenhum comentário:

Postar um comentário

Mais notícias