Το NVLink της πέμπτης γενιάς, που εισήχθη το 2024, σηματοδοτεί μια σημαντική πρόοδο έναντι των προκατόχων της, ιδιαίτερα όσον αφορά το εύρος ζώνης και την επεκτασιμότητα. Εδώ είναι οι βασικές διαφορές μεταξύ του NVLink 5.0 και των προηγούμενων γενεών:
Bandwidth and Speed
- Το NVLink 5.0 προσφέρει σημαντική αύξηση του εύρους ζώνης, παρέχοντας 1,8 TB/s του συνολικού ζώνης αμφίδρομης ανάδυσης ανά GPU. Αυτό επιτυγχάνεται μέσω 18 συνδέσμων NVLink, ο καθένας ικανός να 50 GB/s σε κάθε κατεύθυνση, συνολικού ύψους 100 GB/s ανά σύνδεσμο αμφίδρομα [1] [4].- Το NVLink 4.0, που βρέθηκε σε GPU Hopper, υποστηρίζει 18 συνδέσμους, αλλά με χαμηλότερη ταχύτητα 50 GB/s ανά σύνδεσμο, με αποτέλεσμα ένα συνολικό εύρος ζώνης 900 GB/s [7].
- Το NVLink 3.0, που χρησιμοποιείται σε GPUs ampere όπως το A100, υποστηρίζει έως και 12 συνδέσμους με εύρος ζώνης 50 GB/s ανά σύνδεσμο, επιτυγχάνοντας συνολικά 600 GB/s [7].
Επιμελητικότητα και αρχιτεκτονική
- Το NVLink 5.0 έχει σχεδιαστεί για την αρχιτεκτονική Blackwell, η οποία είναι βελτιστοποιημένη για συστήματα πολλαπλών GPU. Επιτρέπει την απρόσκοπτη επικοινωνία μεταξύ εκατοντάδων GPU, καθιστώντας το ιδανικό για υπολογισμούς Exascale και μεγάλα μοντέλα AI [1] [4].- Οι προηγούμενες γενιές, παράλληλα με τη στήριξη των διαμορφώσεων πολλαπλών GPU, δεν προσέφεραν το ίδιο επίπεδο κλιμάκωσης με το NVLink 5.0. Για παράδειγμα, το NVLink 4.0 χρησιμοποιήθηκε στο Hopper GPU, οι οποίες υποστήριζαν επίσης διαμορφώσεις μεγάλης κλίμακας GPU αλλά με λιγότερο εύρος ζώνης [7].
Τεχνολογία και διασύνδεση
- Το NVLink 5.0 χρησιμοποιεί προχωρημένη σηματοδότηση διαφορικού ζεύγους PAM4, παρόμοια με το NVLink 4.0, αλλά με υψηλότερους ρυθμούς δεδομένων ανά λωρίδα [7].-Οι διακόπτες NVLink διαδραματίζουν κρίσιμο ρόλο στο NVLink 5.0, επιτρέποντας την αποτελεσματική επικοινωνία μεταξύ GPU. Ο διακόπτης NVLink 5 προσφέρει 144 θύρες με χωρητικότητα μεταγωγής μη αποκλεισμού 14,4 TB/s, ενισχύοντας σημαντικά την επεκτασιμότητα σε πολλούς διακομιστές [4].
Εφαρμογές και απόδοση
- Το NVLink 5.0 είναι βελτιστοποιημένο για εφαρμογές υπολογιστών υψηλής απόδοσης, ιδιαίτερα εκείνων που αφορούν μεγάλα μοντέλα AI και υπολογιστικές υπολογιστές. Το αυξημένο εύρος ζώνης του επιτρέπει ταχύτερη ανταλλαγή δεδομένων μεταξύ GPU, η οποία είναι κρίσιμη για τα σύνθετα AI και τα καθήκοντα βαθιάς μάθησης [1] [4].- Οι προηγούμενες γενιές επικεντρώθηκαν επίσης σε εφαρμογές υψηλής απόδοσης, αλλά περιορίστηκαν από το χαμηλότερο εύρος ζώνης τους. Τα NVLink 3.0 και 4.0 χρησιμοποιήθηκαν σε περιβάλλοντα που απαιτούσαν υψηλή υπολογιστική ισχύ, όπως AI και HPC, αλλά με λιγότερη χωρητικότητα για πολύ μεγάλα μοντέλα σε σύγκριση με το NVLink 5.0 [2] [7].
Συνολικά, το NVLink 5.0 αντιπροσωπεύει ένα σημαντικό άλμα προς τα εμπρός όσον αφορά το εύρος ζώνης, την επεκτασιμότητα και την απόδοση, τοποθετώντας το ως κρίσιμο στοιχείο για τις μελλοντικές προόδους στον υπολογισμό του AI και των υψηλών επιδόσεων.
Αναφορές:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-ccelerating-multi-gpu-communication/
[2] https://www.fibermall.com/blog/nvidia-nvlink.htm
[3] https://www.fibermall.com/blog/what-is-nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fibermall.com/blog/evolution-of-nvlink.htm
[6] https://www.nexgencloud.com/blog/performance-benchmarks/nvidia-blackwell-vs-nvidia-hopper-a-detailed-comparison
[7] https://en.wikipedia.org/wiki/nvlink
[8] https://www.naddod.com/blog/unveiling-the-evolution-of-nvlink