NVLink п’ятого покоління, введений у 2024 році, знаменує значне просування щодо своїх попередників, особливо з точки зору пропускної здатності та масштабованості. Ось ключові відмінності між NVLINK 5.0 та попередніми поколіннями:
пропускна здатність та швидкість
- NVLINK 5.0 пропонує значне збільшення пропускної здатності, що забезпечує 1,8 ТБ/с загальної двонаправленої пропускної здатності на GPU. Це досягається через 18 посилань NVLINK, кожен з яких здатний до 50 ГБ/с у кожному напрямку, загалом 100 ГБ/с на зв'язок двосторонньо [1] [4].- NVLINK 4.0, знайдений у графічному процесорі Хоппера, також підтримує 18 посилань, але з меншою швидкістю 50 ГБ/с за посилання, що призводить до загальної пропускної здатності 900 ГБ/с [7].
- NVLINK 3.0, що використовується в AMPERE GPU, як A100, підтримує до 12 посилань із пропускною здатністю 50 ГБ/с за посилання, досягаючи загальної кількості 600 ГБ/с [7].
масштабованість та архітектура
- NVLINK 5.0 призначений для архітектури Блеквелла, яка оптимізована для систем мульти-GPU. Це дозволяє безперешкодно спілкуватися між сотнями графічних процесорів, що робить його ідеальним для обчислень Exascale та великими моделями AI [1] [4].- Попередні покоління, також підтримуючи конфігурації Multi-GPU, не пропонували такого ж рівня масштабованості, як NVLINK 5.0. Наприклад, NVLINK 4.0 використовувався в графічних процесорах Hopper, який також підтримував масштабні конфігурації GPU, але з меншою пропускною здатністю [7].
Технологія та взаємозв'язок
- NVLINK 5.0 використовує передову диференціальну пару PAM4, аналогічно NVLINK 4.0, але з більш високою швидкістю передачі даних на смугу руху [7].-Перемикачі NVLINK відіграють вирішальну роль у NVLINK 5.0, що дозволяє ефективно все-таки спілкуватися між графічними процесорами. Перемикач NVLINK 5 пропонує 144 порти з не блокуючою ємністю перемикання 14,4 ТБ/с, значно підвищуючи масштабованість на декількох серверах [4].
Програми та продуктивність
- NVLINK 5.0 оптимізований для високоефективних обчислювальних додатків, особливо тих, що включають великі моделі AI та обчислення Exascale. Його збільшена пропускна здатність дозволяє більш швидкий обмін даними між графічними процесорами, що є критичним для складних завдань AI та глибокого навчання [1] [4].- Попередні покоління також були зосереджені на високоефективних додатках, але були обмежені нижньою пропускною здатністю. NVLINK 3.0 та 4.0 використовувались у середовищах, що потребують високої обчислювальної потужності, таких як AI та HPC, але з меншою ємністю для дуже великих моделей порівняно з NVLINK 5.0 [2] [7].
Загалом, NVLINK 5.0 являє собою значний стрибок вперед з точки зору пропускної здатності, масштабованості та продуктивності, позиціонуючи його як критичний компонент для майбутніх досягнень в галузі ШІ та високоефективних обчислень.
Цитати:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-accelerating-multi-gpu-communication/
[2] https://www.fibermall.com/blog/nvidia-nvlink.htm
[3] https://www.fibermall.com/blog/what-is-nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fibermall.com/blog/evolution-of-nvlink.htm
[6] https://www.nexgencloud.com/blog/performance-benchmarks/nvidia-blackwell-vs-nvidia-hopper-a-detailed-comparison
[7] https://en.wikipedia.org/wiki/nvlink
[8] https://www.naddod.com/blog/unveiling-the-evolution-of-nvlink