個人中心
登出
中文繁體
返回
登入後諮詢在線客服
回到頂部

NVIDIA泄露了下一代AI GPU「 Blackwell Ultra GB300」的規格-搭載288GB HBM3e內存,性能提升50%

NVIDIA發佈了計劃於2025年下半年推出的下一代用於AI服務器的GPU「Blackwell Ultra GB300」的詳細規格。相比當前的GB200,實現了顯著的性能提升,將AI計算能力提升約1.5倍,但預計功耗將達到1400瓦。
革新性技術規格
GB300的核心是B300芯片,採用了多項創新技術,大幅提升了AI工作負載處理能力。最顯著的進化是存儲容量的擴大,將HBM3e內存從192GB增加到288GB,增強了50%。爲實現這一目標,內存堆棧結構從傳統的8層擴展到12層,實現了更高密度的內存實現。此外,計算板採用LPCAMM內存,實現了更高效的內存訪問。
在性能方面,特別是針對AI推理處理進行優化的FP4計算,與當前的GB200相比實現了約50%的性能提升。這一顯著的性能提升是芯片架構根本性的重新評估和優化的結果。
網絡功能也得到了大幅增強,由ConnectX 7進化到ConnectX 8,數據傳輸能力得到了提升。此外,光模塊也從800G升級到1.6T,帶寬翻倍。這些增強的網絡功能使得在大規模AI模型訓練中,多個GPU之間的數據傳輸更加高效。
在體系結構方面,考慮採用了套接字配置,這有望提高生產力和可維護性。然而,這種設計變更會導致電力供應和冷卻需求的增加,從而對系統整體設計產生重大影響。這些技術創新展示了對迅速發展的AI工作負載需求的綜合應對方法。
值得一提的是,該GB300可能與NVIDIA的下一代架構「Rubin」的推出時間重疊。Rubin計劃採用TSMC的3nm工藝節點和HBM4內存,有望成爲半導體技術演進的重要轉折點。
電力管理和冷卻系統的創新
Blackwell Ultra GB300在其革新性能提升的代價是,面臨着前所未有的電力管理和冷卻挑戰。每個B300芯片消耗着極高的1400W電力,這要求採用與傳統數據中心GPU不同的電力管理系統。
爲了穩定供電和應對瞬斷情況,NVIDIA採用了分層電源備份系統。其中核心部分是每個GB300 NVL72機櫃上標配的300多個超級電容器。每個超級電容器的生產成本約爲20至25美元,每個機櫃的電力管理系統成本相當高。此外,作爲可選,提供的電池備份單元(BBU)的製造成本約爲300美元每個模塊,整個系統需要約1500美元的高昂成本。
冷卻系統也得到了完全革新。採用了新設計的水冷板,液冷系統加強了高性能快速斷開(UQD)。這些改進確保了應對前所未有的1400W散熱量的冷卻能力。值得特別關注的是,整個系統已過渡到基於液冷的設計,這個決定也影響着製造夥伴的選擇。例如,富士康擁有豐富的液冷系統生產經驗,因此被選爲GB300的主要供應商。
這些電力管理和冷卻系統的革新是新時代高性能計算中的重要技術里程碑。然而,同時也暗示着需要從根本上重新審視數據中心的設計和運營的現有常識。從傳統的空風冷數據中心向液冷系統的轉變需要涉及設施設計到操作程序的廣泛領域的變革。這種變革可能成爲下一代AI基礎設施的新標準。
NVIDIA的新產品承諾驚人的性能提升,同時也凸顯了嚴重的問題。高達1,400W的功耗將給數據中心的電力基建帶來重大負擔。此外,採用300多個超級電容也在可靠性和成本兩方面提出了新的挑戰。
然而,更有趣的是,這款產品所暗示的未來方向。由人工智能熱潮帶來的需求增長正在迫使半導體行業進行新的範式轉變。當前需要不得不追求性能提升的情況,即使要付出功耗增加的代價,表明行業正接近轉折點。
免責聲明:社區由Moomoo Technologies Inc.提供,僅用於教育目的。 更多信息
16
1
+0
1
原文
舉報
瀏覽 1.9萬
評論
登錄發表評論