share_log

“芯片队长”黄仁勋遭遇“ASIC时刻”?

「芯片隊長」黃仁勳遭遇「ASIC時刻」?

時代財經 ·  01/09 07:30

「你們喜歡我的外套嗎?」

1月7日,着一身經典黑色皮衣的黃仁勳閃亮登場,開啓了他長達90分鐘的「CES個人秀」。

這位英偉達創始人兼首席執行官在現場手持Grace Blackwell NVLink72的Wafer晶圓「盾牌」,在臺上擺出「美國隊長」的造型來,他揚言要做出一個巨型芯片。

「Blackwell系統的奇蹟在於其前所未有的規模,Blackwell芯片是人類歷史上最大的單芯片。我們的最終目標是Physical AI。」「芯片隊長」黃仁勳表示,英偉達能夠滿足全球幾乎所有數據中心的需求。

上一年的CES,黃仁勳沒有亮相主題演講,但是在今年的CES,美國時間晚上6點半開始的演講,下午4點就已經有上百人排隊。

在生成式AI潮起後,放眼望去,英偉達似乎還未逢敵手。然而,巨大的蛋糕讓衆多科技公司虎視眈眈,今年CES前夕,就有英偉達的對手殺入了「萬億市值俱樂部」。

攪弄風雲的是另一位華人——博通CEO陳福陽。近日來,ASIC(專用集成電路)成爲芯片界的熱詞,陳福陽預言到2027年,市場對定製款AI芯片ASIC的需求規模將達到600億至900億美元。

在今年1月,市場傳言稱,英偉達或已經成立ASIC部門,並計劃招募上千名芯片設計、軟件開發及AI研發人員。不過,業內知情人士向時代財經記者否認了上述傳聞。

賺得盆滿鉢滿的英偉達仍是GPU的忠實擁躉,但科技巨頭們卻想擺脫對它的過度依賴。ASIC讓它們看到了破局的希望。陳福陽此前就表示,公司正在與美國三家大型雲計算廠商開發定製AI芯片。消息稱,博通目前的客戶包括谷歌、Meta、字節跳動、蘋果和OpenAI等。

據時代財經記者了解,雖然目前ASIC芯片能夠滿足一部分AI算力需求,但它與GPU還談不上替代關係。有業內人士透露,AI市場規模巨大,部分公司做針對性的專用型芯片屬於正常現象。目前,很多大企業都在做,或着試着做這類產品。

黃仁勳演講結束後,截至1月7日美股收盤,英偉達跌超過6%,1月8日截至發稿盤前回漲,漲超1.2%。

黃仁勳的野心

英偉達仍然野心勃勃。

2024年3月,英偉達宣佈重磅推出新一代AI芯片架構Blackwell。據了解,Blackwell擁有2080億個晶體管,是上一代芯片「Hopper」800億個晶體管的兩倍多,可以支持多達10萬億個參數的AI模型。首款採用Blackwell架構的芯片名爲GB200。

不過,在之後幾個月,英偉達Blackwell芯片幾次被曝延遲交付。報道稱,Blackwell AI芯片在高容量服務器機架中存在嚴重的過熱問題,這些問題導致設計調整與項目延期。

去年11月,在英偉達2024年第三財季業績會上,黃仁勳就此回應稱,Blackwell芯片已全面投產,預計將在未來幾個財季供不應求。

在此次CES上,黃仁勳又一次提到了這一情況。他表示,Blackwell相比於前一代在性能上實現了四倍的提升。目前,所有主要雲服務提供商均已建立系統就緒,15家計算機制造商已經推出了約200種不同型號和配置。其中包括採用液冷和風冷的x86 Nvidia GPU版本,還有NVLink 36x2和NVLink 72x1等不同類型的系統,能夠滿足全球幾乎所有數據中心的需求。這些系統正在大約45家工廠進行製造。

引人注意的是,黃仁勳還準備推出巨型芯片。黃仁勳在臺上舉起一個半人高的芯片模型向觀衆展示。

「我們的目標是創建一個名爲Grace Blackwell NVLink72的巨型芯片。」黃仁勳表示。

據他介紹,該芯片將使用72個Blackwell GPU,有130萬億個晶體管,重量達1.5噸,有60萬個零部件,功耗120千瓦,芯片背後有一根「脊柱」連接所有部件。這個芯片還包含5000根銅纜,總長度達2英里。這個芯片有14TB內存,內存帶寬爲每秒1.2TB,基本上相當於全世界Internet Plus-related上的所有流量都能在此處理。

GPU之外的更多可能

在90分鐘的演講中,黃仁勳並未提及ASIC芯片相關的話題,似乎前段時間博通帶起的資本熱潮對他並無影響。

儘管知情人士否認了近日英偉達爲ASIC「招兵買馬」的傳聞,但這已不是英偉達第一次傳出佈局ASIC的消息。據路透社去年2月報道,英偉達正在建立一個新的業務部門,專注於爲雲廠商等公司設計定製芯片,包括先進的AI處理器。

同年6月,報道稱英偉達CEO黃仁勳曾在一場新聞發佈會上被問及進軍ASIC市場的傳聞,黃仁勳彼時首次說了「Yes!」以確定這一決定。

或許在博通爆火前,英偉達已經看到了ASIC芯片的潛力。無論英偉達最終打不打算拓展這一塊業務,ASIC芯片已經在AI芯片界闖出了名頭。

據業內人士介紹,芯片一般分爲三類,一類是以CPU和GPU爲代表的非ASIC芯片,即通用芯片。這類芯片被設計應用於處理各種不同的計算任務,優勢在於通用性與技術生態,劣勢在於高功耗,在業務範圍較明確的場景下,高能耗、低能效比的問題就尤爲突出。

第二類是靈活的可編程芯片FPGA,主要廠商包括AMD、Altera等。這類芯片允許用戶通過編碼對芯片內部的邏輯功能進行配置和重新配置,因此多用於科研領域、商業數字產品預研發階段。

第三類是ASIC或者說XPU芯片。此類芯片的誕生是因爲市場需求發展到一定階段後,某些細分領域需求突顯,針對這些細分領域,芯片設計廠家針對性的設計研發出XPU芯片,在匹配這些細分市場需求的同時也降低了產品製造成本。

「一旦此類ASIC芯片實現批量生產,即在一定程度上將程序固化於硬件,可以將性能和效率在原有基礎上提升數倍,且功耗也遠低於CPU或GPU。」上述業內人士表示。

科技巨頭們也瞄準了這一點。例如,谷歌早在十年前就力推自研AI芯片TPU(張量處理器,ASIC芯片的代表),該系列芯片也是與博通合作生產。去年12月12日,谷歌宣佈正式向Google Cloud客戶開放第六代TPU Trillium。亞馬遜的ASIC產品包括Trainium和Inferentia,分別用於訓練和推理環節。微軟和Meta也推出了各自的ASIC產品Maia 100和MTIA。

不過,在Omdia半導體產業研究總監何暉看來,英偉達的GPU作爲通用型產品,對於大規模算力中心而言必不可少。然而,不同AI公司擁有各自的核心算法,往往更適合在自定義的硬件架構上運行。此時,博通這類能夠提供ASIC服務的公司,就成爲了重要補充。

「對於任何從事AI算力硬件架構的公司來說,通用性和定製化都是必須同時具備的特質。」何暉表示。

TrendForce集邦諮詢分析師邱珮雯則認爲,ASIC偏向特定客戶定製化,GPU通常爲標準品,適用於多數客戶。而且,相較於高階NVIDIA芯片如B200,ASIC目前開發運算效能落差仍大。因此,ASIC和GPU有各自的目標市場及應用。

從目前的市場反饋來看,ASIC芯片更多被作爲GPU之外的一種補充。

爲什麼是博通?

博通成立於1991年,事實上已經在ASIC領域深耕多年,堪稱該領域的「老大哥」。

單從業績數據來看,博通仍處於增收不增利的狀態。2024財年博通營收516億美元,同比增長44%,但凈利潤58.95億美元,同比下降58%。不過具體業務看,博通的人工智能業務全財年營收同比增長220%至122億美元,驅動半導體業務的收入創新高至301億美元。

陳福陽在業績會議上預期樂觀:「我們目前有三家超大規模客戶,他們已經制定了自己的多代AI XPU路線圖,計劃在未來三年內以不同速度部署。我們相信,到2027年,他們每家都計劃在單一架構上部署100萬XPU集群。」

何暉認爲,博通的優勢在於「連接」。「在AI時代,算力與互聯技術均扮演着至關重要的角色。」她表示,博通在接口類的芯片方面能力較強,在計算類芯片領域也積累了多年的豐富經驗,因此能夠將這兩項關鍵技術有效地結合在一起,爲客戶提供先進的加速計算解決方案。這也是爲何英偉達一直在積極推進NVLink技術的原因。

芯和半導體創始人、總裁代文亮認爲,「博通推出了3.5D F2F(Face-to-Face)技術,能夠顯著提升芯片的互連密度、功率效率和性能。」

去年底,博通宣佈推出3.5D eXtreme Dimension系統級(XDSiP)封裝平台技術。這是業界首個3.5D F2F封裝技術,在單一封裝中集成超過6000mm²的硅芯片和多達12個HBM內存堆棧,以滿足AI芯片的高集成、高功率、高能效的計算需求。

代文亮告訴時代財經記者,3.5D F2F封裝技術是一種架構創新,在此之前,業界比較常見的先進封裝技術,要麼是2.5D封裝,要麼是通過橋接芯片放在下面。3.5D F2F封裝也許不是最優方案,但給產業提供了另一個解決當前痛點問題的路徑。

代文亮進一步補充,目前行業裏對於AI算力的需求暴漲,英偉達的通用GPU一卡難求,這時候能效比就顯得越來越重要。通用GPU由於要兼顧多種類型的計算任務,這種靈活性勢必會犧牲在特定應用上的性能和效率,譬如視頻處理、網絡通信、深度學習等,特別是在高負載或持續運行的情況下,這種現象越加明顯。ASIC 芯片由於是爲了某一特定應用專門定製的,這本身就是一個優勢,在同等工況下,博通的ASIC芯片就能做到效能大幅提升,算力其實也非常強勁,更適合要求精確、高效處理的應用。「這種競爭的心態也是值得鼓勵的,行業內通過百花齊放的創新把性能提高,而不是無止盡地內卷,把價格卷低。」

博通之後,還有誰?

「對我們而言是利好。」在博通一炮而紅後,有國內從事ASIC芯片的業內人士告訴時代財經記者,博通將XPU的歷史地位抬高了,這讓他們感受到了鼓舞。

1月3日,第三方數據機構IDC發佈最新的加速計算服務器市場預測數據顯示,2024年中國加速服務器市場規模190億美元,同比2023年增長87%。其中GPU(圖形處理器)服務器依然是主導地位,佔據74%的市場份額。然而,到2028年,中國加速計算服務器市場規模將超過550億美元,其中ASIC加速服務器市場佔比將接近40%。

也許未來,ASIC的市場份額會快速增長,但並無法取代通用處理器。

邱珮雯表示,雲端業者除了採用NVIDIA GPU以外,也將積極研發自身ASIC芯片。這既能針對自身應用定製化以外,還能降低對NVIDIA芯片之依賴,並同時減少支出成本。博通本身爲IC設計公司,也提供IC設計代工服務於客戶,是否對於其他芯片廠造成衝擊主要取決於客戶是否要自行開發IC,進而替代原先供應商。

上述業內人士認爲,ASIC芯片能否單獨運作,取決於應用場景。例如,某地要建立一個數據中心,如果只是服務於科研領域的AI計算任務,那麼定製化的ASIC芯片基於具有更低功耗和專用特性,可以以算力利用率更高效的特點來滿足該需求。但如果該數據中心還需處理交通、安防等任務,那麼此時則更傾向於使用GPU。服務對象決定了對芯片類型的選擇。

「當一個市場領域展現出巨大的潛力時,必然會湧現出專用芯片。因爲該領域的市場規模足夠大,值得企業投入資源去開發專用芯片,通過大規模生產來降低成本,充分發揮高效利用率,並搶佔市場份額。這就是ASIC芯片背後市場意義。」該業內人士表示。

目前,國產的AI芯片廠商有很多選擇了ASIC方向。例如,獨角獸企業中昊芯英專注於國產TPU芯片及其解決方案賽道,這也是ASIC芯片之一,2023年下半年,中昊芯英全自研的GPTPU架構高性能人工智能芯片剎那實現了量產。據介紹,2024年下半年,該公司一方面落地了更多智算中心項目,另一方面也在加強生態建設,進一步優化軟體平台,打造軟硬件一體化的結合,使之更適合國內企業快速部署和獨立使用。

另外,AI芯片第一股寒武紀-U(688256.SH)的方向也是ASIC。據Wind數據,近一年來寒武紀的股價漲了480.34%,截至1月8日收盤,寒武紀漲1.11%,報726元/股,市值已超過3000億元。

在代文亮看來,未來,小場景的AI應用、小參數模型會越來越多。「千億參數、萬卡集群大部分時候是少數廠商玩家的遊戲,大多數功能和場景的實現並不需要這種量級的硬件支持。」此外,端側AI,AI PC和手機的概念越來越受關注,其實也側面印證了這個趨勢。所以,ASIC定製化芯片可以說是「性價比」相當高的選擇。責任編輯:櫟樹

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論