RX 9070 XT AI Boost Kinerja dengan Dukungan FP8 dan Arsitektur RDNA 4

Bagaimana Tugas AI RX 9070 XTS meningkatkan tugas AI dibandingkan dengan model sebelumnya

Dukungan RX 9070 XT untuk operasi FP8 (8-bit floating point) secara signifikan meningkatkan tugas AI dibandingkan dengan model sebelumnya, terutama yang didasarkan pada arsitektur RDNA 3. FP8 adalah format presisi yang lebih rendah yang mencakup mode seperti BF8 (Brain Float 8) dan HF8 (setengah float presisi), yang dioptimalkan untuk meningkatkan efisiensi inferensi dalam tugas pembelajaran AI dan mesin. Dukungan ini memungkinkan GPU untuk menangani beban kerja AI lebih cepat tanpa mengorbankan akurasi yang signifikan.

Dibandingkan dengan rDNA 3, arsitektur RDNA 4 dalam RX 9070 XT menggandakan throughput FP16 baseline dan menggandakannya lagi untuk operasi yang jarang. Untuk beban kerja FP8, throughput meningkat hingga 8 kali dibandingkan dengan operasi FP16 pada rDNA 3. Peningkatan substansial dalam throughput ini sangat bermanfaat untuk tugas yang sangat bergantung pada multiplikasi matriks, seperti yang ditemukan dalam model pembelajaran mesin.

Instruksi matriks gelombang yang disempurnakan Multiply Acumpulate (WMMA) dalam rDNA 4 lebih lanjut mengoptimalkan kinerja untuk tugas AI. Perbaikan ini memungkinkan RX 9070 XT untuk memberikan kinerja yang jauh lebih baik dalam aplikasi seperti Adobe Lightroom dan DaVinci Resolve, dengan kinerja hingga 34% lebih baik dibandingkan dengan RX 7900 GRE. Untuk tugas AI generatif, seperti pembuatan gambar difusi yang stabil, RX 9070 XT hingga 70% lebih cepat dari pendahulunya.

Namun, sementara RX 9070 XT unggul dalam tugas AI yang terikat-terikat, ia mungkin menghadapi keterbatasan dalam beban kerja yang terikat memori karena bus memori 256-bit, yang menyediakan hingga 640 GB/s bandwidth. Ini kurang dari 800 GB/s 7900 XT dan 960 GB/s XTX, yang berpotensi berdampak pada tugas yang membutuhkan bandwidth memori tinggi, seperti model bahasa besar (LLM).

Secara keseluruhan, dukungan FP8 RX 9070 XT dan akselerator AI yang ditingkatkan memposisikannya sebagai opsi kompetitif untuk tugas AI, terutama yang mendapat manfaat dari peningkatan kinerja komputasi dan tipe data presisi yang lebih rendah. Namun, efisiensi dan kinerjanya dalam aplikasi AI intensif memori dapat bervariasi dibandingkan dengan GPU kelas atas lainnya.

Kutipan:
[1] https://www.theregister.com/2025/02/28/amd_rx_9070_series/
[2] https://www.neowin.net/news/amd-details-windows-11-ai-performance-gains-on-rx-9070-xt-vs-7900/
[3.
[4] https://www.reddit.com/r/localllama/comments/1j088yg/rx_9070_xt_potential_performance_discussion/
[5] https://windowsforum.com/threads/amd-rx-9070-series-unleashing-ai-and-gaming-power-on-windows-11.354177/?amp=1
[6] https://www.guru3d.com/review/amd-announcesces-radeon-rx-9070-and-9070-xt-peview/page-2/
[7] https://gizmodo.com/amd-unleashes-the-radeon-rx-9070-gpus-2000569514
[8] https://www.storagereview.com/review/asus-prime-amd-radeon-rx-9070-xt-and-rx-9070-review
[9] https://www.pcgamer.com/hardware/graphics-cards/amd-has-frestically-revealed-its-rdna-4 berbasis-rx-9070-and-rx-9070-xt-gpus-and-they-lot-lot-like-rdna-3-on-t-turbo-reving
[10] https://www.tweaktown.com/news/103556/amds-official-benchmarks-for-the-radeon-rx-9070-xt-and-across-30-games/index.html