สถานี NVIDIA DGX A100 ได้รับการออกแบบมาเพื่อจัดการผู้ใช้หลายคนและการเข้าถึงระยะไกลอย่างมีประสิทธิภาพทำให้เป็นโซลูชันที่เหมาะสำหรับทีมวิทยาศาสตร์ข้อมูลและองค์กรที่ต้องการทรัพยากร AI ส่วนกลาง นี่คือวิธีจัดการความสามารถเหล่านี้:
การจัดการผู้ใช้หลายคน
- Multi-Instance GPU (MIG): สถานี DGX A100 รองรับ MIG ซึ่งอนุญาตให้จัดสรรอุปกรณ์ GPU มากถึง 28 เครื่องให้กับผู้ใช้หรืองานแต่ละคน ซึ่งหมายความว่าผู้ใช้หลายคนสามารถแบ่งปัน GPU เดียวกันพร้อมกันโดยไม่ส่งผลกระทบต่อประสิทธิภาพของระบบ MIG ช่วยให้แต่ละอินสแตนซ์ GPU มีหน่วยความจำแคชและสตรีมมิ่งมัลติโปรเซสเซอร์ของตัวเองเพื่อให้มั่นใจว่าการใช้ทรัพยากรที่มีประสิทธิภาพ [1] [2]
- เวิร์กโหลดแบบขนาน: ระบบมีความสามารถในการฝึกอบรมการอนุมานและการวิเคราะห์เวิร์กโหลดแบบขนาน สิ่งนี้ช่วยให้ผู้ใช้หลายคนสามารถทำงานในโครงการที่แตกต่างกันได้พร้อมกันใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Nvidia A100 GPUs ที่เชื่อมต่อถึงกันทั้งสี่ [1] [4]
- การแบ่งปันทรัพยากร: MIG อำนวยความสะดวกในการแบ่งปันทรัพยากรระหว่างผู้ใช้หลายคนเช่นนักเรียนหรือสมาชิกของทีมวิทยาศาสตร์ข้อมูล คุณสมบัตินี้มีประโยชน์อย่างยิ่งสำหรับการประเมินงานการอนุมานหลายงานหรือใช้สมุดบันทึก Jupyter สำหรับการสำรวจแบบจำลอง [2]
การเข้าถึงและการจัดการระยะไกล
- การจัดการระยะไกล: สถานี DGX A100 มีความสามารถในการจัดการระยะไกลที่แข็งแกร่ง ผู้ใช้สามารถจัดการระบบจากระยะไกลโดยใช้อินเทอร์เฟซบนเว็บที่ให้บันทึกระบบโดยละเอียดการอ่านเซ็นเซอร์และการตรวจสอบประสิทธิภาพ ซึ่งรวมถึงการตรวจสอบอุณหภูมิของ GPU, หน่วยความจำ DIMMS, CPU และส่วนประกอบอื่น ๆ [2]
- IPMI และ KVM: ระบบรองรับ IPMI (อินเทอร์เฟซการจัดการแพลตฟอร์มอัจฉริยะ) สำหรับการตรวจสอบและจัดการอัตโนมัติ นอกจากนี้ยังมีฟังก์ชันการทำงานของ KVM (คีย์บอร์ดวิดีโอเมาส์) ช่วยให้ผู้ใช้สามารถเข้าถึงการแสดงผลของระบบและจัดการได้จากระยะไกลราวกับว่าพวกเขามีอยู่จริง ซึ่งรวมถึงความสามารถในการจัดเก็บข้อมูลเสมือนสำหรับการบูตระยะไกลหรือติดตั้งระบบใหม่ [2]
- โปรโตคอลที่ปลอดภัย: โปรโตคอลที่ปลอดภัยเช่น SSH สามารถตั้งค่าเพื่อเปิดใช้งานการเข้าถึงระยะไกลไปยังสถานี DGX จากเครื่องจักรที่แตกต่างกัน สิ่งนี้ช่วยให้ผู้ใช้สามารถจัดการเวิร์กโหลด AI ได้อย่างยืดหยุ่นจากทุกที่ [5]
-อินเทอร์เฟซการจัดการระบบ NVIDIA: ผู้ใช้สามารถใช้เครื่องมือบรรทัดคำสั่งการจัดการระบบ NVIDIA (NVIDIA-SMI) เพื่อตรวจสอบและจัดการประสิทธิภาพ GPU รวมถึงเปอร์เซ็นต์การใช้งานและค่าอุณหภูมิ [5]
โดยรวมแล้วสถานี DGX A100 เป็นโซลูชันที่มีประสิทธิภาพและเป็นมิตรกับสำนักงานสำหรับผู้ใช้หลายคนและการเข้าถึงระยะไกลทำให้เหมาะสำหรับสภาพแวดล้อมที่หลากหลายตั้งแต่สำนักงานของ บริษัท ไปจนถึงโรงงานวิจัย
การอ้างอิง:
[1] https://www.compecta.com/dgxstation-a100.html
[2] https://www.robusthpc.com/wp-content/uploads/2021/11/nvidia-dgx-station-a100-system-architecture-white-paper_published.pdf
[3] https://docs.nvidia.com/dgx/pdf/dgx-station-user-guide.pdf
[4] https://www.e4company.com/wp-content/uploads/dgx-family-print-dgx-station-a100-datasheet-us-partner.pdf
[5] https://www.fibermall.com/blog/nvidia-dgx-systems.htm
[6] https://opentools.ai/news/nvidia-unleashes-the-future-with-personal-ai-supercomputers
[7] https://www.techpowerup.com/forums/threads/nvidia-announces-dgx-spark-dgx-station-personal-ai-computers.334300/
[8] https://www.serversimply.com/blog/how-to-connect to-nvidia-dgx-cloud-advantages-configurations-and-setup-guide