NVLINK 5.0 เป็นการวนซ้ำล่าสุดของ NVIDIA เกี่ยวกับเทคโนโลยีการเชื่อมต่อระหว่างความเร็วสูงพิเศษที่ออกแบบมาเพื่อเพิ่มการสื่อสารโดยตรงระหว่าง GPU หลายตัวภายในระบบ เทคโนโลยีนี้มีความสำคัญอย่างยิ่งสำหรับปริมาณงานที่ใช้ GPU มากเช่นการฝึกอบรม AI และการคำนวณประสิทธิภาพสูง นี่คือวิธีที่ NVLink 5.0 จัดการการถ่ายโอนข้อมูลระหว่าง GPU หลายตัว:
สถาปัตยกรรมและแบนด์วิดท์
NVLINK 5.0 ถูกสร้างขึ้นสำหรับสถาปัตยกรรม Blackwell และให้แบนด์วิดท์เพิ่มขึ้นอย่างมีนัยสำคัญเมื่อเทียบกับรุ่นก่อน แบล็กเวลล์ GPU แต่ละตัวรองรับการเชื่อมต่อ NVLINK มากถึง 18 ครั้งโดยแต่ละลิงก์ให้แบนด์วิดท์แบบสองทิศทางที่ 100 GB/s ส่งผลให้แบนด์วิดท์ทั้งหมด 1.8 TB/s ต่อ GPU ซึ่งเป็นสองเท่าของรุ่นก่อนหน้าและมากกว่า 14 เท่าของแบนด์วิดท์ของ PCIe Gen5 [1] [2] [4]
การสื่อสารโดยตรง GPU-to-GPU
NVLINK ช่วยให้การสื่อสารโดยตรงระหว่าง GPU โดยไม่จำเป็นต้องมีตัวกลาง CPU ลดเวลาแฝงและประสิทธิภาพสูงสุด สถาปัตยกรรมการเชื่อมต่อแบบจุดไปยังจุดนี้ทำให้มั่นใจได้ว่า GPU แต่ละตัวมีลิงก์เฉพาะสำหรับ GPU อื่น ๆ ทุกตัวเพื่อให้สามารถถ่ายโอนข้อมูลได้อย่างรวดเร็วโดยไม่ต้องใช้การแชร์แบนด์วิดท์ [7]
สวิตช์ NVLink เพื่อความสามารถในการปรับขนาด
ชิปสวิตช์ NVLINK มีบทบาทสำคัญในการปรับการเชื่อมต่อ NVLINK ใน GPU หลายตัวทั้งภายในและระหว่างชั้นวางเซิร์ฟเวอร์ ช่วยอำนวยความสะดวกในการสื่อสาร GPU ทั้งหมดด้วยความเร็ว NVLink เต็มรูปแบบเปลี่ยนศูนย์ข้อมูลให้เป็น GPU ยักษ์ได้อย่างมีประสิทธิภาพ การตั้งค่านี้รองรับ GPU ที่เชื่อมต่ออย่างเต็มที่ถึง 576 ในผ้าคำนวณที่ไม่ปิดกั้นทำให้แอปพลิเคชัน AI และ HPC ขนาดใหญ่ [1] [2] [4]
การดำเนินการโดยรวมด้วยความคมชัด
สวิตช์ NVLINK แต่ละตัวจะมีเครื่องยนต์สำหรับการรวมลำดับชั้นและการลดลงของโปรโตคอล (SHARC) ซึ่งเร่งความเร็วของ NVIDIA ซึ่งเร่งการลดการลดลงของเครือข่ายและการทำงานแบบหลายผู้รับ นี่เป็นสิ่งจำเป็นสำหรับงานรวมความเร็วสูงในสภาพแวดล้อม AI และ HPC ทำให้สามารถประมวลผลชุดข้อมูลขนาดใหญ่และโมเดลที่ซับซ้อนได้อย่างมีประสิทธิภาพ [2] [4]
แอปพลิเคชันและผลประโยชน์
NVLINK 5.0 ได้รับการออกแบบมาเพื่อรองรับการพัฒนาและการปรับใช้โมเดล AI ที่มีมูลค่าหลายล้านล้านพารามิเตอร์และแอพพลิเคชั่นการคำนวณแบบ exascale ด้วยการให้การสื่อสารความเร็วสูงและมีประสิทธิภาพระหว่าง GPU ทำให้สามารถแลกเปลี่ยนข้อมูลและการประมวลผลได้เร็วขึ้นซึ่งเป็นสิ่งสำคัญสำหรับงานการคำนวณที่ซับซ้อน เทคโนโลยีนี้เป็นส่วนสำคัญในการแก้ปัญหาศูนย์ข้อมูลของ NVIDIA ซึ่งนำเสนอความสามารถในการปรับขนาดและประสิทธิภาพที่ไม่เคยมีมาก่อนสำหรับแพลตฟอร์ม AI และ HPC [1] [2] [4]
การอ้างอิง:
[1] https://hardwarenation.com/resources/blog/nvidia-nvlink-5-0-Accelerating-multi-gpu-communication/
[2] https://www.amax.com/fifth-generation-nvidia-nvlink/
[3] https://www.fibermall.com/blog/nvidia-nvlink.htm
[4] https://www.nvidia.com/en-us/data-center/nvlink/
[5] https://www.fs.com/blog/fs-an-overview-of-nvidia-nvlink-2899.html
[6] https://massedcompute.com/faq-answers/?question=how+does+nvlink+handle+data+transfer+between+gpus+in+a+system+with
[7] https://www.amax.com/unleashing-next-level-gpu-performance-with-nvidia-nvlink/
[8] https://forums.developer.nvidia.com/t/nvlink-support-for-connecting-4-gpus/253975