在性能方面,特別是針對AI推理處理進行優化的FP4計算,與當前的GB200相比實現了約50%的性能提升。這一顯著的性能提升是芯片架構根本性的重新評估和優化的結果。
網絡功能也得到了大幅增強,由ConnectX 7進化到ConnectX 8,數據傳輸能力得到了提升。此外,光模塊也從800G升級到1.6T,帶寬翻倍。這些增強的網絡功能使得在大規模AI模型訓練中,多個GPU之間的數據傳輸更加高效。
在體系結構方面,考慮採用了套接字配置,這有望提高生產力和可維護性。然而,這種設計變更會導致電力供應和冷卻需求的增加,從而對系統整體設計產生重大影響。這些技術創新展示了對迅速發展的AI工作負載需求的綜合應對方法。
tm_speedstyle371 : 太棒了。再次提高了銷量 非常感謝。