เพิ่มความสามารถในการปรับขนาดด้วย Nvidia DGX Station A100 และ MIG Technology

เทคโนโลยี MIG (Multi-Instance GPU) ช่วยเพิ่มความสามารถในการปรับขนาดของสถานี NVIDIA DGX A100 ได้อย่างมีนัยสำคัญโดยอนุญาตให้แบ่งพาร์ติชันของ GPU แต่ละตัวออกเป็นหลายกรณีที่แยกได้อย่างเต็มที่ คุณสมบัตินี้ช่วยให้สถานี DGX สามารถรองรับผู้ใช้หรือทีมหลายคนพร้อมกันทำให้เหมาะอย่างยิ่งสำหรับสภาพแวดล้อมการทำงานร่วมกันหรือพื้นที่ทำงานที่ใช้ร่วมกัน

การปรับปรุงคีย์

1. การแบ่งพาร์ติชันทรัพยากร: MIG อนุญาตให้มีการแบ่งพาร์ติชันของ GPU เดี่ยวเข้ากับอินสแตนซ์อิสระเจ็ดครั้งโดยแต่ละรายการมีหน่วยความจำเฉพาะแคชและสตรีมมิ่งมัลติโปรเซสเซอร์ของตัวเอง สิ่งนี้ทำให้มั่นใจได้ว่าแต่ละอินสแตนซ์ทำงานอย่างอิสระโดยไม่ต้องแข่งขันกับทรัพยากรซึ่งจะเป็นการเพิ่มประสิทธิภาพและการใช้ประโยชน์จาก GPU [4] [8]

2. รับประกันคุณภาพของการบริการ (QoS): โดยการจัดหาทรัพยากรที่แยกได้สำหรับแต่ละอินสแตนซ์ MIG ทำให้มั่นใจได้ว่าประสิทธิภาพที่คาดการณ์ได้และรับประกัน QoS สิ่งนี้เป็นประโยชน์อย่างยิ่งสำหรับการทำงานหลายงานพร้อมกันเช่นการร้องขอการอนุมาน AI โดยไม่ส่งผลกระทบต่อประสิทธิภาพของระบบ [8] [9]

3. การสนับสนุนผู้ใช้หลายคน: สถานี DGX A100 สามารถจัดหาอินสแตนซ์ GPU ได้มากถึง 28 ครั้งเมื่อเปิดใช้งาน GPU ทั้งสี่ด้วย MIG สิ่งนี้ช่วยให้ผู้ใช้หลายคนสามารถเข้าถึงและใช้ระบบพร้อมกันทำให้เหมาะสำหรับทีมวิทยาศาสตร์ข้อมูลและสถาบันการศึกษา [2] [7]

4. ความยืดหยุ่นในการปรับใช้: MIG รองรับตัวเลือกการปรับใช้ต่างๆรวมถึงการใช้งานแอปพลิเคชัน CUDA บนโลหะเปลือยหรือคอนเทนเนอร์ ความยืดหยุ่นนี้ได้รับการปรับปรุงเพิ่มเติมโดยชุดเครื่องมือคอนเทนเนอร์ NVIDIA ซึ่งช่วยให้ผู้ใช้สามารถเรียกใช้คอนเทนเนอร์ที่เร่งด้วย CUDA ในอินสแตนซ์ GPU [4] [9]

5. ความสามารถในการปรับขนาดและความคุ้มค่า: โดยการเปิดใช้งานผู้ใช้หลายคนในการแบ่งปันทรัพยากร GPU เดียวกันอย่างมีประสิทธิภาพ MIG ช่วยลดความจำเป็นในการตั้งค่า GPU แต่ละรายการหรือการเช่าคลาวด์ สิ่งนี้ทำให้สถานี DGX เป็นโซลูชันที่คุ้มค่าสำหรับองค์กรโดยเฉพาะอย่างยิ่งเมื่อเปรียบเทียบกับการเช่าทรัพยากร GPU คลาวด์เมื่อเวลาผ่านไป [1] [5]

ใช้เคส

- การฝึกอบรมและการอนุมานของ AI: MIG อนุญาตให้ GPU ที่แตกต่างกันในสถานี DGX ได้รับการกำหนดค่าสำหรับเวิร์กโหลดที่แตกต่างกันเช่นการฝึกอบรม AI, HPC หรือการวิเคราะห์ข้อมูล ความยืดหยุ่นนี้เป็นสิ่งสำคัญสำหรับองค์กรที่จำเป็นต้องจัดการปริมาณงาน AI ที่หลากหลายอย่างมีประสิทธิภาพ [4] [10]

- สภาพแวดล้อมทางการศึกษาและการวิจัย: ความสามารถในการสนับสนุนผู้ใช้หลายคนพร้อมกันทำให้สถานี DGX เป็นประโยชน์อย่างยิ่งสำหรับสถาบันการศึกษาและห้องปฏิบัติการวิจัยซึ่งทรัพยากรที่ใช้ร่วมกันเป็นเรื่องธรรมดา [1] [4]

โดยสรุปเทคโนโลยี MIG ช่วยเพิ่มความยืดหยุ่นของสถานี DGX โดยให้สภาพแวดล้อมที่มีความยืดหยุ่นและมีผู้ใช้หลายคนซึ่งเพิ่มการใช้ GPU ให้สูงสุดในขณะที่มั่นใจได้ว่าประสิทธิภาพที่คาดการณ์ได้ สิ่งนี้ทำให้สถานี DGX เป็นแพลตฟอร์มที่เหมาะสำหรับการวิจัยและพัฒนา AI การทำงานร่วมกันในอุตสาหกรรมต่างๆ

การอ้างอิง:
[1] https://www.toolify.ai/ai-news/experience-the-power-of-nvidia-dgx-station-a100-971252
[2] https://www.globenewswire.com/news-release/2020/11/16/2127366/0/en/nvidia-dgx-station-a100-fers-researchers-ai-data-center-in-box.html
[3] https://images.nvidia.com/aem-dam/en-zz/solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf
[4] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[5] https://www.eweek.com/big-data-and-analytics/how-nvidia-a100-station-brings-data-center-heft-to-workgroups/
[6] https://docs.nvidia.com/datacenter/tesla/mig-user-guide/
[7] http://nvidianews.nvidia.com/news/nvidia-dgx-station-a100-fers-researchers-ai-data-center-in-a-box
[8] https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
[9] https://www.skyblue.de/uploads/datasheets/nvidia_twp_dgx_a100_system_architecture.pdf
[10] https://www.compecta.com/dgxstation-a100.html
[11] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf

เทคโนโลยี MIG ช่วยเพิ่มความสามารถในการปรับขนาดของสถานี DGX ได้อย่างไร

การปรับปรุงคีย์

ใช้เคส