如果您希望可以時常見面,歡迎標星 收藏哦~
來源:內容編譯自tomshardware,謝謝。
據知名分析師郭明錤在Medium上的報道,英偉達已暫停開發基於GB200的雙機架72路NVL36×2,以集中資源開發單機架的NVL72和NVL36。這位分析師以其內部消息來源的準確性而聞名。單機架的NVL36和NVL72機器將按計劃上市,英偉達此舉的原因據稱是由於資源有限以及客戶的偏好。然而,早前的報道顯示,雙機架的NVL36×2被認爲是英偉達客戶中最受歡迎的選擇。
最初,英偉達計劃開發三款基於Blackwell GPU的GB200型號,用於AI和高性能計算(HPC)工作負載,分別爲NVL36、NVL72和NVL36×2。然而,管理所有三個項目變得具有挑戰性,尤其是在同時開發兩個不同的72 GPU版本(NVL72和NVL36×2)的情況下。因此,英偉達現在只專注於NVL72和NVL36。
英偉達的GB200 NVL72機架包含18個計算托盤和9個NVSwitch托盤(18個NVSwitch ASIC),每個托盤有兩塊Bianca板,每塊板上有一個Grace CPU和兩個Blackwell GPU。這是英偉達最強大的產品,但也是功耗最高的解決方案,耗電約120kW。
根據SemiAnalysis的預計,由於極端的功率和密度需求(典型機架功率爲12kW,而基於H100的機架消耗約40kW),大多數數據中心無法支持這一配置的廣泛使用。然而,有一個主要客戶計劃大規模部署該產品,郭明錤指出,微軟明顯傾向於選擇NVL72而非NVL36×2。
GB200 NVL36×2原計劃由兩個互聯的機架組成,最初被認爲是更常見的配置。每個機架有18個Grace CPU和36個Blackwell GPU,能夠保持72個GPU之間的完全互聯。然而,它需要36個NVSwitch ASIC,因此功耗比NVL72更高,性能略低。一個GB200 NVL36×2機架預計每個機架消耗66kW(總計132kW),儘管功耗稍高,但其較大的尺寸更適合現有的數據中心。
GB200 NVL72在空間利用率上遠勝於GB200 NVL36×2。然而,大多數英偉達客戶無法支持NVL72的功率和冷卻密度需求。此外,複雜性可能導致GB200 NVL72的發貨時間推遲至2025年下半年。郭明錤稱,儘管早前的報道顯示,部分NVL72機器將在今年12月交付,預計是交付給微軟。
「我最新的供應鏈調查顯示,NVL72的大規模生產可能會推遲到2025年下半年(相比英偉達樂觀預測的2025年上半年),」郭明錤寫道。
今年早些時候,英偉達在其B100和B200 GPU的封裝中遇到了導致產量下降的問題,這促使公司生產低產量的Blackwell硬件以滿足需求,並且改進了這些處理器的設計。改進後的GPU預計將在10月下旬開始大規模生產,因此將在明年1月底投入使用。在此背景下,專注於面向最苛刻客戶的GB200 NVL72設計,對於追求最大性能的英偉達來說是完全合理的。
還需要注意的是,基於x86的搭載Blackwell處理器的服務器要到2025年才會推出。此階段,這些機器的外形規格尚未確定,初步報告顯示可能會採用NVL72和NVL36×2的配置。不過,現在看來,英偉達的重點已轉向首先推出NVL72和NVL36機架,隨後將由第三方定製解決方案推出。
參考鏈接