La prise en charge du RX 9070 XT pour les opérations FP8 (point flottant 8 bits) améliore considérablement les tâches d'IA par rapport aux modèles précédents, en particulier ceux basés sur l'architecture de l'ADNr 3. FP8 est un format de précision inférieur qui comprend des modes comme BF8 (Brain Float 8) et HF8 (Float de demi-précision), qui sont optimisés pour améliorer l'efficacité de l'inférence dans l'IA et les tâches d'apprentissage automatique. Ce support permet au GPU de gérer plus rapidement les charges de travail de l'IA sans sacrifier une précision significative.
Par rapport à l'ADNr 3, l'architecture de l'ADNr 4 dans le RX 9070 XT double le débit FP16 de base et le double à nouveau pour les opérations clairsemées. Pour les charges de travail FP8, le débit est augmenté jusqu'à 8 fois par rapport aux opérations FP16 sur l'ADNr 3. Cette augmentation substantielle du débit est particulièrement bénéfique pour les tâches qui reposent fortement sur les multiplications matricielles, telles que celles trouvées dans les modèles d'apprentissage automatique.
La matrice d'onde améliorée multipliez les instructions accumulées (WMMA) dans l'ADNr 4 optimiser davantage les performances des tâches AI. Ces améliorations permettent au RX 9070 XT de fournir des performances considérablement meilleures dans des applications telles que Adobe Lightroom et Davinci Resolve, avec jusqu'à 34% de performances meilleures par rapport au RX 7900 GRE. Pour les tâches AI génératives, telles que la génération d'images de diffusion stable, le RX 9070 XT est jusqu'à 70% plus rapide que son prédécesseur.
Cependant, bien que le RX 9070 XT excelle dans les tâches AI liées à des calculs, il peut faire face à des limitations dans les charges de travail liées à la mémoire en raison de son bus mémoire 256 bits, qui fournit jusqu'à 640 Go / s de bande passante. Il s'agit de moins que les 800 Go / s du 7900 XT et les 960 Go / s du XTX, ce qui a un impact potentiellement sur les performances des tâches qui nécessitent une bande passante de mémoire élevée, telles que les modèles de grandes langues (LLM).
Dans l'ensemble, le support FP8 du RX 9070 XT et les accélérateurs AI améliorés le positionnent comme une option compétitive pour les tâches d'IA, en particulier celles qui bénéficient d'une amélioration des performances de calcul et des types de données de précision inférieurs. Cependant, son efficacité et ses performances dans les applications d'IA à forte intensité de mémoire peuvent varier par rapport à d'autres GPU haut de gamme.
Citations:[1] https://www.thegister.com/2025/02/28/amd_rx_9070_series/
[2] https://www.neowin.net/news/amd-details-windows-11-ai-performance-gains-on-rx-9070-xt-vs-7900/
[3] https://www.tomshardware.com/pc-components/gpus/amd-rdna4-rx-9000-series-gpus specifications-pricing-release-date
[4] https://www.reddit.com/r/localllama/comments/1j088yg/rx_9070_xt_potential_performance_discussion/
[5] https://windowsforum.com/threads/amd-rx-9070-series-unleashing-ai-and-gaming-power-on-windows-11.354177/?amp=1
[6] https://www.guru3d.com/review/amd-announs-radeon-rx-9070-and-9070-xt-preview/page-2//
[7] https://gizmodo.com/amd-unleashes-the-radeon-RX-9070-gpus-2000569514
[8] https://www.storagereview.com/review/asus-prime-amd-radeon-rx-9070-xt-and-fx-9070-review
[9] https://www.pcgamer.com/hardware/graphics-cards/amd-has official-revealed-ITS-RDNA-4-basased-bated-9070-and-rx-9070-xt-gpus-and-yy-wlok-a-lot-like-rdna-3-only-turbocharged/
[10] https://www.tweaktown.com/news/103556/amdsofficial-benchmarks-for-the-radeon-rx-9070-xt-and-across-30-games/index.html