Advertisement

Microsoft เปิดตัวคลัสเตอร์ GB300 NVL72 ระดับซูเปอร์คอมพิวเตอร์ — รวมพลัง 4,608 GPU ทำงานเป็นหนึ่งเดียวเพื่อยุคใหม่ของ AI

Microsoft

Microsoft สร้างความฮือฮาในวงการเทคโนโลยีอีกครั้ง ด้วยการเปิดตัว GB300 NVL72 คลัสเตอร์ซูเปอร์คอมพิวเตอร์รุ่นใหม่บนแพลตฟอร์ม Azure Cloud ซึ่งใช้สถาปัตยกรรม NVIDIA GB300 Blackwell Ultra และถูกยกให้เป็นระบบระดับ “supercomputer-scale AI cluster” ตัวแรกของโลกที่ GPU ทุกตัวสามารถทำงานประสานกันได้เหมือนเป็น “ชิปขนาดยักษ์เพียงตัวเดียว”

คลัสเตอร์นี้ใช้ GPU จำนวนมหาศาลถึง 4,608 ตัว โดยแบ่งเป็น 64 rack แต่ละ rack ประกอบด้วย 72 GPU และ 36 CPU Grace ที่ถูกเชื่อมต่อเข้าด้วยกันผ่านเทคโนโลยี NVLink 5 และ NVSwitch 3 ส่งผลให้ GPU ภายใน rack สามารถแลกเปลี่ยนข้อมูลได้ด้วยแบนด์วิดท์สูงถึง 130 เทราไบต์ต่อวินาที (TB/s) ซึ่งถือว่าเร็วที่สุดเท่าที่เคยมีมาในระบบคอมพิวเตอร์เชิงพาณิชย์

supercomputer-scale AI cluster

Microsoft และ NVIDIA ออกแบบระบบนี้ให้ทุก rack ทำงานเป็น unified accelerator หรือ “หน่วยเร่งการประมวลผลเดียว” ก่อนจะเชื่อม rack ทั้งหมดเข้าหากันผ่านโครงข่าย NVIDIA Quantum-X800 InfiniBand ที่ให้ความเร็วระดับ 800 กิกะบิตต่อวินาทีต่อ GPU เพื่อให้ระบบทั้ง 4,608 GPU สื่อสารกันแบบไร้รอยต่อทั้งคลัสเตอร์ ผลลัพธ์คือความสามารถด้านการคำนวณแบบ inference สูงถึง 1.44 exaflops หรือราว 1,440 petaflops ซึ่งมากพอสำหรับโมเดล AI ขนาดใหญ่ระดับหลายล้านล้านพารามิเตอร์

นอกจากพลังการคำนวณที่มหาศาล ระบบนี้ยังมาพร้อมหน่วยความจำรวมภายใน rack ราว 37 เทราไบต์ ซึ่งเกิดจากการรวม HBM3E VRAM ของ GPU เข้ากับ LPDDR5X RAM ของ CPU Grace เพื่อรองรับงาน AI และ machine learning ที่ต้องใช้ข้อมูลขนาดใหญ่ในหน่วยความจำเดียวโดยไม่ต้องถ่ายโอนผ่านระบบ I/O ภายนอก

Microsoft ระบุว่า GB300 NVL72 ถูกออกแบบมาสำหรับ งาน AI ขั้นสูงโดยเฉพาะ เช่น reasoning models, multimodal learning และ agentic AI รวมถึงโมเดล OpenAI รุ่นต่อไปที่ต้องการทรัพยากรการคำนวณมหาศาล บริษัทคาดว่าระบบใหม่นี้จะช่วยให้การฝึกและทดสอบโมเดลใหญ่ (Large Language Models) ทำได้ภายใน “ไม่กี่สัปดาห์” แทนที่จะกินเวลาหลายเดือนเหมือนในอดีต ทั้งยังใช้พลังงานและพื้นที่ใน data center อย่างมีประสิทธิภาพมากกว่าเดิมด้วยระบบระบายความร้อนด้วยของเหลวเต็มรูปแบบ

การเปิดตัว GB300 NVL72 ครั้งนี้จึงเป็นอีกก้าวสำคัญของ Microsoft ในการยืนยันตำแหน่งผู้นำด้านโครงสร้างพื้นฐาน AI ระดับโลก และยังสะท้อนถึงความร่วมมือกับ NVIDIA และ OpenAI ที่แน่นแฟ้นมากขึ้นเรื่อย ๆ ในยุคที่การคำนวณระดับ exascale กำลังกลายเป็นมาตรฐานใหม่ของอุตสาหกรรม เทคโนโลยี

แหล่งข้อมูล tomshardware

Leave a Reply

Your email address will not be published. Required fields are marked *