Η υποστήριξη του RX 9070 XT για τις λειτουργίες FP8 (8-bit floating Point) ενισχύει σημαντικά τα καθήκοντα AI σε σύγκριση με προηγούμενα μοντέλα, ιδιαίτερα εκείνα που βασίζονται στην αρχιτεκτονική RDNA 3. Το FP8 είναι μια μορφή χαμηλότερης ακρίβειας που περιλαμβάνει τρόπους όπως το BF8 (Brain Float 8) και το HF8 (Half Precision Float), οι οποίες βελτιστοποιούνται για τη βελτίωση της απόδοσης της απόδοσης των εργασιών AI και μηχανικής μάθησης. Αυτή η υποστήριξη επιτρέπει στη GPU να χειρίζεται τον φόρτο εργασίας του AI πιο γρήγορα χωρίς να θυσιάζει σημαντική ακρίβεια.
Σε σύγκριση με το RDNA 3, η αρχιτεκτονική RDNA 4 στο RX 9070 XT διπλασιάζει τη βασική απόδοση FP16 και το διπλασιάζει ξανά για αραιές λειτουργίες. Για τους φόρτους εργασίας του FP8, η απόδοση αυξάνεται έως και 8 φορές σε σύγκριση με τις λειτουργίες FP16 στο rDNA 3. Αυτή η ουσιαστική αύξηση της διακίνησης είναι ιδιαίτερα επωφελής για τα καθήκοντα που βασίζονται σε πολλαπλασιασμούς των μήτρας, όπως αυτά που βρίσκονται στα μοντέλα μηχανικής μάθησης.
Οι οδηγίες ενισχυμένης μήτρας κύματος πολλαπλασιάζονται (WMMA) στο RDNA 4 περαιτέρω βελτιστοποιούν την απόδοση για εργασίες AI. Αυτές οι βελτιώσεις επιτρέπουν στο RX 9070 XT να προσφέρει σημαντικά καλύτερη απόδοση σε εφαρμογές όπως το Adobe Lightroom και το Davinci Resolve, με έως και 34% καλύτερη απόδοση σε σύγκριση με το RX 7900 GRE. Για γενετικές εργασίες AI, όπως η σταθερή παραγωγή εικόνων διάχυσης, το RX 9070 XT είναι έως και 70% ταχύτερο από τον προκάτοχό του.
Ωστόσο, ενώ το RX 9070 XT υπερέχει σε εργασίες AI με υπολογισμό, μπορεί να αντιμετωπίσει περιορισμούς στο φόρτο εργασίας που συνδέονται με τη μνήμη λόγω του δίαυλου μνήμης των 256 bit, ο οποίος παρέχει έως και 640 GB/s του εύρους ζώνης. Αυτό είναι μικρότερο από τα 800 GB/s του 7900 X και το XTX 960 GB/s, ενδεχομένως επηρεάζοντας την απόδοση σε εργασίες που απαιτούν υψηλό εύρος ζώνης μνήμης, όπως μεγάλα γλωσσικά μοντέλα (LLMS).
Συνολικά, η υποστήριξη FP8 του RX 9070 XT και οι ενισχυμένοι επιταχυντές AI το τοποθετούν ως ανταγωνιστική επιλογή για εργασίες AI, ειδικά εκείνες που επωφελούνται από τη βελτίωση των υπολογιστικών επιδόσεων και των τύπων δεδομένων χαμηλότερης ακρίβειας. Ωστόσο, η αποτελεσματικότητα και η απόδοσή του σε εφαρμογές AI έντασης μνήμης ενδέχεται να διαφέρουν σε σύγκριση με άλλες GPU υψηλής τεχνολογίας.
Αναφορές:[1] https://www.theregister.com/2025/02/28/amd_rx_9070_series/
[2] https://www.neowin.net/news/amd-details-windows-11-ai-performance-gains-on-rx-9070-xt-vs-7900/
[3] https://www.tomshardware.com/pc-components/gpus/amd-rdna4-rx-9000-series-gpus-specification
[4] https://www.reddit.com/r/localllama/comments/1j088yg/rx_9070_xt_potential_performance_discussion/
[5] https://windowsforum.com/threads/amd-rx-9070-series-unleashing-ai-and-gaming-power-on-windows-11.354177/?amp=1
[6] https://www.guru3d.com/review/amd-announces-radeon-rx-9070-and-9070-xt-preview/page-2/
[7] https://gizmodo.com/amd-unleashes-the-radeon-rx-9070-gpus-2000569514
[8] https://www.storagereview.com/review/asus-prime-amd-radeon-rx-9070-xt-and-and-rx-9070-review
[9] https://www.pcgamer.com/hardware/graphics-cards/amd-has-officially-vealed-its-rdna-4-rx-9070--rx-9070-xt-gpus-and-they-look-a-lot-like-rdna-3-onlboboarged/
[10] https://www.tweaktown.com/news/103556/amds-official-benchmarks-for-the-radeon-rx-9070-xt-and-across-30-bames/index.html