O suporte do RX 9070 XT para operações de FP8 (ponto flutuante de 8 bits) aprimora significativamente as tarefas de IA em comparação com os modelos anteriores, particularmente aqueles baseados na arquitetura RDNA 3. O FP8 é um formato de precisão mais baixo que inclui modos como BF8 (Float Brain 8) e HF8 (hali precision float), que são otimizados para melhorar a eficiência da inferência nas tarefas de IA e aprendizado de máquina. Esse suporte permite que a GPU lide com cargas de trabalho de IA mais rapidamente, sem sacrificar uma precisão significativa.
Comparado ao RDNA 3, a arquitetura RDNA 4 no RX 9070 XT dobra a taxa de transferência da linha de base FP16 e a dobra novamente para operações esparsas. Para cargas de trabalho do FP8, a taxa de transferência é aumentada em até 8 vezes em comparação com as operações FP16 no RDNA 3. Esse aumento substancial na taxa de transferência é particularmente benéfico para tarefas que dependem fortemente das multiplicações da matriz, como as encontradas nos modelos de aprendizado de máquina.
A matriz de onda aprimorada multiplicar as instruções de multiplicação (WMMA) no RDNA 4 otimizam ainda mais o desempenho para tarefas de IA. Essas melhorias permitem que o RX 9070 XT ofereça um desempenho significativamente melhor em aplicativos como Adobe Lightroom e Davinci Resolve, com até 34% de desempenho em comparação com o RX 7900 GRE. Para tarefas generativas de IA, como geração estável de imagem de difusão, o RX 9070 XT é até 70% mais rápido que seu antecessor.
No entanto, enquanto o RX 9070 XT se destaca em tarefas de IA ligadas a computação, ele pode enfrentar limitações nas cargas de trabalho ligadas à memória devido ao seu barramento de memória de 256 bits, que fornece até 640 GB/s de largura de banda. Isso é menor que os 800 GB/se do 7900 XT e o 960 GB/s do XTX, afetando potencialmente o desempenho em tarefas que requerem alta largura de banda de memória, como modelos de linguagem grandes (LLMs).
No geral, o suporte FP8 do RX 9070 XT e os aceleradores de IA aprimorados o posicionam como uma opção competitiva para tarefas de IA, especialmente aquelas que se beneficiam do desempenho aprimorado da computação e dos tipos de dados de baixa precisão. No entanto, sua eficiência e desempenho em aplicativos de IA intensivos em memória podem variar em comparação com outras GPUs de ponta.
Citações:[1] https://www.theregister.com/2025/02/28/amd_rx_9070_series/
[2] https://www.neowin.net/news/amd-details-windows-11-ai-permance-gains-on-rx-9070-xt-vs-7900/
[3] https://www.tomshardware.com/pc-components/gpus/amd-rdna4-rx-9000-series-gpus especificações-precificações-de-release
[4] https://www.reddit.com/r/localllama/comments/1j088yg/rx_9070_xt_potencial_performance_discussion/
[5] https://windowsforum.com/threads/amd-rx-9070-series-unleashing-ai-and-gaming -power-on-windows-11.354177/?amp=1
[6] https://www.guru3d.com/review/amd-announces-radeon-rx-9070-and-9070-xt-preview/page-2/
[7] https://gizmodo.com/amd-unleases-the-radeon-rx-9070-gus-2000569514
[8] https://www.storagereview.com/review/asus-prime-amd-radeon-rx-9070-xt-and-rx-9070-review
[9] https://www.pcgamer.com/hardware/graphicscards/amd-has- official- revealed-its-rdna-4-4-rx-9070-and-rx-9070-xt-t-gpus-and-ylow-um-like-rdna-3-1ly-turbox/tbo
[10] https://www.tweaktown.com/news/103556/amds-fficial-benchmarks-for-the-radeon-rx-9070-xt-and-across-30-games/index.html