中文繁體
返回
下載
登入後諮詢在線客服
回到頂部

Nvidia已中止開發GB200 NVL36*2(雙機架72 GPU版本)🤔

分析師Ming-Chi Kuo先生表示,「Nvidia已經取消了GB200 NVL36*2(雙機架72 GPU版本)的開發。長期的AI和Nvidia趨勢仍持續良好,但產品計畫的頻繁變更可能會緩解短期交易情緒」- Medium
未來,除非有定制要求,Nvidia只會提供GB200 NVL72(以下簡稱NVL72)的單機架版本,雙機架版本(NVL36*2)將被停用。GB200 NVL36(以下簡稱NVL36)的單機架將保持最初的開發計劃和出貨計劃。

這種開發不會影響AI與Nvidia的長期積極趨勢。但短期內,有些市場參與者可能會對Nvidia和供應鏈的執行能力產生疑問。
Nvidia最近頻繁修改AI服務器產品路線圖,反映他們試圖在有限的資源下改善供應鏈執行、競爭優勢和顧客需求的平衡,其中包括NVL36*2開發的取消等。這表明Nvidia對產品計畫已採取更實際的方法,但這種轉變可能令一些市場參與者感到困惑。
由於對Blackwell服務器2025年產品出貨結構的可見度較低(數月前,市場一般認為只有NVL36、NVL72、NVL36*2),一些組裝和冷卻解決方案供應商可能會對2025年的前景產生重大影響。
兩款72 GPU模型比較:選擇NVL72的理由以及刪除NVL36的原因*2
開發資源有限。最初的計劃是同時開發3個GB200項目(NVL36、NVL72、NVL36*2)。從11月中旬開始的開發組件(DevDrop)將集中在NVL72和NVL36*2上(NVL36在理論上已準備進入量產階段),並且雙方的最終品質保證(QA)預計將於2025年3月中旬完成。但是,由於NVL36的開發存在不確定性,同時開發兩個72GPU版本(NVL72和NVL36*2)將更加困難。
NVL72可以節省數據中心空間。如果能夠適當應對側面冷卻設計的挑戰,NVL72比NVL36*2少了一個機架,這將提高數據中心的空間效率。
NVL72 的推理效率更高。NVL72 和 NVL36*2 都是享受可以進行並行設計的軟體,對AI LLM的培訓結果幾乎沒有差異。然而,在無法進行並行處理或難以進行并行處理的推理過程(例如自回歸模型)中,NVL72 傾向於比 NVL36*2 更優秀。
客戶的主要偏好是微軟等客戶更青睞 NVL72 而不是 NVL36*2。
NVIDIA 一直在推廣基于單機架的 NVL72,以實現政府的承諾。由於資源的限制,在這些承諾的背後,優先考慮了 NVL72 的開發而不是 NVL36*2。
NVL72 的開發面臨前所未有的技術挑戰,生產時間表仍然未知。
NVL72 開發的最大挑戰主要源自132 kW 熱設計功率(TDP)要求。由於這個要求,NVL72 已成為有史以來最耗電量最高的伺服器。NVIDIA 及其供應鏈需要更多時間來解決前所未有的技術問題。
需要注意 TDP 指的是連續運行時的平均功耗。由於設計不足,導致峰值功耗(NVIDIA 中的電力設計點 (EDP))超出 TDP 時,可能需要兩台以上的側面散熱器。這將導致散熱設計變得更加複雜,製造變得困難,同時還會損失 NVL72 數據中心的省空間優勢。
另一個側面散熱器的設計挑戰是穩定控制接近溫度在5至10°C內,但如果放寬這個標準,可能會影響系統穩定性。
前述高功耗的問題不僅在於側面散熱器,還與所有組件和系統設計有關。
據我的最新供應期權鏈調查,NVL72的量產可能會延遲到25年下半年(與Nvidia樂觀的目標25年上半期相比)。
免責聲明:社區由Moomoo Technologies Inc.提供,僅用於教育目的。 更多信息
14
+0
1
原文
舉報
瀏覽 4.8萬
評論
登錄發表評論
小学5年生のネコのピンハネの頭脳で、ウェーブのパターン分析で継続的なシナリオ予想。経済学・地政学・法学。
6453
粉絲
3
關注
5.2萬
來訪
關注

熱門市場機會

市場熱議龍頭榜 市場熱議龍頭榜
立即解鎖