Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Як підтримка FP8 RX 9070 XT підвищує завдання AI порівняно з попередніми моделями


Як підтримка FP8 RX 9070 XT підвищує завдання AI порівняно з попередніми моделями


Підтримка RX 9070 XT для операцій FP8 (8-бітна плаваюча точка) значно підвищує завдання AI порівняно з попередніми моделями, особливо з тими, що базуються на архітектурі RDNA 3. FP8 - це нижчий точний формат, який включає такі режими, як BF8 (Float 8 Mass 8) та HF8 (половина точності точності), які оптимізовані для підвищення ефективності введення в АІ та завдань машинного навчання. Ця підтримка дозволяє GPU обробляти робочі навантаження AI більш швидко, не жертвуючи значною точністю.

Порівняно з rDNA 3, архітектура RDNA 4 у RX 9070 XT подвоює базову пропускну здатність FP16 і знову подвоює її для розріджених операцій. Для робочих навантажень FP8 пропускна здатність збільшується до 8 разів порівняно з операціями FP16 на рДНК 3. Це суттєве збільшення пропускної здатності є особливо корисним для завдань, які значною мірою покладаються на матричні багатополікації, такі як, знайдені в моделях машинного навчання.

Посилена хвильова матриця множна накопичувальна (WMMA) інструкції в рДНК 4 додатково оптимізує продуктивність для завдань AI. Ці вдосконалення дозволяють RX 9070 XT забезпечити значно кращу продуктивність у таких додатках, як Adobe Lightroom та Davinci Resolve, при цьому до 34% кращі показники порівняно з RX 7900 GRE. Для генеративних завдань AI, таких як стабільна генерація зображень дифузії, RX 9070 XT на 70% швидше, ніж його попередник.

Однак, хоча RX 9070 XT перевершує завдання, пов'язані з обчисленням AI, він може зіткнутися з обмеженнями в робочих навантаженнях, пов'язаних з пам'яттю, завдяки 256-бітній шині пам'яті, що забезпечує до 640 ГБ/с пропускної здатності. Це менше, ніж 800 ГБ/с 7900 ГБ та 960 ГБ/с XTX, що потенційно впливає на продуктивність у завданнях, які потребують високої пропускної здатності пам'яті, таких як великі мови (LLMS).

Загалом, підтримка FP8 RX 9070 XT та покращені прискорювачі AI позиціонують це як конкурентоспроможний варіант для завдань AI, особливо тих, що отримують користь від покращення ефективності обчислення та нижчих типів точності. Однак його ефективність та продуктивність в інтенсивних додатках AI в пам'яті можуть відрізнятися порівняно з іншими висококласними графічними процесорами.

Цитати:
[1] https://www.theregister.com/2025/02/28/amd_rx_9070_series/
[2] https://www.neowin.net/news/amd-details-windows-11-ai-performance-gains-on-rx-9070-xt-vs-7900/
[3] https://www.tomshardware.com/pc-components/gpus/amd-rdna4-rx-9000-series-gpus-scifications-prising-date-date
[4] https://www.reddit.com/r/localllama/comments/1j088yg/rx_9070_xt_potential_performance_discussion/
[5] https://windowsforum.com/threads/amd-rx-9070-series-unleashing-ai-and-gaming-power-on-windows-11.354177/?amp=1
[6] https://www.guru3d.com/review/amd-announces-radeon-rx-9070-and-9070-xt-preview/page-2/
[7] https://gizmodo.com/amd-unleashes-the-radeon-rx-9070-gpus-2000569514
[8] https://www.storagereview.com/review/asus-prime-amd-radeon-rx-9070-xt-and-rx-9070-review
[9] https://www.pcgamer.com/hardware/graphics-cards/amd-has officially-revealed-its-rdna-4-rx-9070-and-rx-9070-xt-gpus-and-they-a-lot-like-rdna-only-turbocharged/
[10] https://www.tweaktown.com/news/103556/amds official-benchmarksfor-the-radeon-rx-9070-xt-and-across-30-games/index.html