Nvidia GB10 Superchip และ Nvidia GB300 ได้รับการออกแบบมาเพื่อเพิ่มความสามารถในการประมวลผล AI แต่แตกต่างกันอย่างมีนัยสำคัญในสถาปัตยกรรมประสิทธิภาพและกรณีการใช้งานที่ตั้งใจไว้
gb10 superchip
GB10 Superchip ขึ้นอยู่กับสถาปัตยกรรม Nvidia Grace Blackwell และได้รับการปรับให้เหมาะสมสำหรับปัจจัยฟอร์มเดสก์ท็อปขนาดกะทัดรัด มันมี GPU แบล็กเวลล์ที่แข็งแกร่งพร้อมแกนเทนเซอร์รุ่นที่ห้าและการสนับสนุน FP4 ส่งมอบการดำเนินงานสูงสุด 1,000 ล้านล้านต่อวินาที (ยอด) ของพลังการประมวลผล AI [1] [3] GB10 รวมถึง CPU แขน 20 คอร์ซึ่งช่วยเพิ่มการประมวลผลข้อมูลล่วงหน้าและการประสานการปรับจูนแบบจำลองและการอนุมานแบบเรียลไทม์ [1] [4] มันมีหน่วยความจำที่สอดคล้องกันแบบรวม 128GB ช่วยให้นักพัฒนาสามารถจัดการโมเดล AI ได้มากถึง 200 พันล้านพารามิเตอร์ [1] [7] GB10 เหมาะสำหรับนักวิจัยและนักพัฒนา AI ที่ต้องการการคำนวณ AI ที่ทรงพลังบนเดสก์ท็อปของพวกเขาสำหรับการสร้างต้นแบบและการปรับแต่ง AI แบบจำลอง [6] [7]
nvidia gb300
ในทางตรงกันข้าม Nvidia GB300 ถูกสร้างขึ้นด้วยสถาปัตยกรรม Grace Blackwell Ultra และได้รับการออกแบบมาสำหรับปริมาณงาน AI ที่ต้องการมากขึ้นโดยเฉพาะอย่างยิ่งในสภาพแวดล้อมขององค์กร มันมี Blackwell Ultra GPU พร้อมแกนเทนเซอร์ล่าสุดและความแม่นยำ FP4 ซึ่งเชื่อมต่อกับ CPU Nvidia Grace ที่มีประสิทธิภาพสูงผ่าน NVLINK-C2C [3] [5] GB300 นำเสนอความจุหน่วยความจำที่เพิ่มขึ้นอย่างมากโดยมี HBM3E สูงถึง 288GB ซึ่งรองรับรุ่นที่ใหญ่กว่าในหน่วยความจำโดยตรงและลดเวลาแฝงสำหรับแอปพลิเคชันแบบเรียลไทม์ [2] [6] superchip นี้เป็นส่วนหนึ่งของสถานี DGX ซึ่งให้พื้นที่หน่วยความจำที่เชื่อมโยงกัน 784GB ขนาดใหญ่ทำให้เหมาะสำหรับการฝึกอบรมขนาดใหญ่และการอนุมานเวิร์กโหลด [3] [6] GB300 ได้รับการปรับให้เหมาะสมสำหรับงานฝึกอบรมและการอนุมานด้วยความสามารถของเครือข่ายที่เพิ่มขึ้นผ่านการ์ดเครือข่าย CX8 และโมดูลออปติคัล 1.6T เพิ่มแบนด์วิดท์เป็นสองเท่าเมื่อเทียบกับรุ่นก่อน [2]
ความแตกต่างที่สำคัญ
- ประสิทธิภาพและสถาปัตยกรรม: GB10 มอบประสิทธิภาพ AI ได้สูงสุด 1 Petaflop ในขณะที่ GB300 มีพลังการคำนวณที่สูงขึ้นอย่างมีนัยสำคัญโดยมุ่งเน้นไปที่ปริมาณงาน AI ขนาดใหญ่
- ความจุหน่วยความจำ: GB10 มีหน่วยความจำแบบครบวงจร 128GB ในขณะที่ GB300 มี HBM3E สูงถึง 288GB และเมื่อรวมเข้ากับระบบเช่นสถานี DGX สามารถให้หน่วยความจำที่สอดคล้องกันได้สูงสุด 784GB
- การใช้งานที่ตั้งใจ: GB10 ได้รับการออกแบบมาสำหรับการพัฒนาเดสก์ท็อป AI เหมาะสำหรับนักวิจัยและนักพัฒนาที่ต้องการการปรับใช้แบบจำลอง AI ทันที GB300 มีเป้าหมายในสภาพแวดล้อมขององค์กรซึ่งรองรับความต้องการโครงสร้างพื้นฐาน AI ขนาดใหญ่
- เครือข่ายและความสามารถในการปรับขนาด: GB300 รวมถึงความสามารถในการสร้างเครือข่ายขั้นสูงด้วยการ์ดเครือข่าย CX8 ซึ่งเพิ่มแบนด์วิดท์เป็นสองเท่าทำให้เหมาะสำหรับศูนย์ข้อมูล Hyperscale และการปรับใช้ AI ขนาดใหญ่ GB10 สามารถเชื่อมต่อสองระบบผ่าน ConnectX-7 NICS สำหรับการจัดการรุ่นที่ใหญ่กว่า แต่ไม่สามารถปรับขนาดได้เท่ากับ GB300 ในสภาพแวดล้อมศูนย์ข้อมูลขนาดใหญ่
การอ้างอิง:
[1] https://press.asus.com/news/press-releases/asus-introduces-ascent-gx-10-ai-supercomputer-powered-by-nvidia-gb-10-grace-blackwell-superchip/
[2] https://drrobertcastellano.substack.com/p/nvidia-gb300-redefining-ai-computing
[3] https://nvidianews.nvidia.com/news/nvidia-announces-dgx-spark-and-dgx-station-personal-ai-computers
[4] https://www.bigdatawire.com/this-just-in/nvidia-unveils-project-digits-personal-ai-supercomputer/
[5] https://www.nvidia.com/en-us/data-center/dgx-gb300/
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7] https://meta-quantum.today/?p=3460
[8] https://www.nvidia.com/en-us/data-center/gb300-nvl72/
[9] https://nvidianews.nvidia.com/news/nvidia-puts-grace-blackwell-on-erery-desk-and-at-erery-ai-developers-fingertips