太多人關注大模型的算力,以至於忽略AI生態系統中的其他環節,存儲是其中的代表。
計算、存儲、網絡是數字基礎設施的三大件,三者緊密聯繫又互相依賴,計算需要數據,數據傳輸依賴網絡,原始數據、過程數據、結果數據都需要存儲,在大模型的訓練和推理過程中,任何一個環節的低效都會演變爲整個系統的低效。
慧榮科技股份有限公司((Silicon Motion Technology Corp.,NasdaqGS:SIMO,以下簡稱慧榮科技)1995年成立於美國加州硅谷,2005年在納斯達克上市。慧榮科技擁有20年以上的設計開發經驗,爲SSD及其他固態存儲裝置提供存儲解決方案,應用範圍包括智能手機、PC數據中心、商業及工控應用等,是全球最大的NAND Flash主控芯片供應商,其中SSD主控芯片的出貨量全球第一。
2023年底,慧榮科技公佈了新的組織架構,成立終端與車用存儲(Client & Automotive Storage; CAS)和企業級存儲與顯示接口解決方案(Enterprise Storage & Display Interface Solution; ESDI)兩大業務群,前者負責消費級SSD主控芯片、移動存儲主控芯片、Ferri 產品和擴展式存儲主控芯片,後者負責企業級SSD主控芯片和顯示接口產品。
關於大模型對存儲的影響,企業級和消費級存儲的現狀,Arm和RISC-V的趨勢等話題,鈦媒體近日對話了慧榮科技終端與車用存儲業務群資深副總段喜亭。
慧榮科技終端與車用存儲業務群資深副總段喜亭
企業級存儲持續上揚,預計第四季度傳導至消費級市場
相較於以GPU爲代表的大模型算力,和支持千卡、萬卡互聯的大模型網絡,存儲在普通用戶層面受到的關注不多,但在產業和市場層面,存儲的供需和價格說明了內在聯繫。
“內存原廠顆粒價格不斷升高,消費級終端需求不佳,上半年零售市場對存儲的需求不高,但企業級存儲市場的增長非常強勁,多少都與大模型帶來的需求相關,全球主要CSP仍在建設大規模數據中心,這也是廠商不願降低閃存顆粒的價格的主要原因之一。”慧榮科技終端與車用存儲業務群資深副總段喜亭表示。
“大模型對於存儲的帶動正在從企業級蔓延至消費級,只有在數據中心層面的計算、網絡和存儲都準備好,大模型的風口才會吹響終端,目前已經顯露出一些苗頭。”段喜亭表示。
他預估,下半年內存合約價格維持上漲的態勢不變,但是漲價幅度會逐漸收斂,企業級存儲的需求能否持續也是一個很大的影響因素。
在消費級領域,下半年AIPC和AI手機逐步開始推向市場,但是對於存儲的帶動可能要到第四季度才有所顯現。四季度最新一代蘋果手機的發佈,將是首款接入大模型的蘋果手機,行業都在關注蘋果的示範效應,是否能帶來足夠大的推力,將很大程度影響存儲的供需關係。
不同於數據中心,大模型進入終端至少還有三重難關,成本、能耗和微型化,三種呈現出互相關聯的關係。
企業級數據中心大量採購英偉達GPU以及高頻寬內存(HBM)等產品,價格始終居高不下,對於消費者而言,手機和PC產品的價格是影響購買決策的關鍵因素,大模型手機可能導致價格大幅升高,必然會影響到普及。
專用芯片和HBM等帶來更強的功能,也會帶來更高的能耗,目前手機電池容量提升的空間較小,因此需要將大模型經過一系列優化,以適應終端場景,大模型參數的微型化是主要方向之一。
10億參數的大模型佔用手機內存空間約爲1GB,在很多場景,終端所搭載的大模型參數已經降至數億以內,終端大模型不追求“大”,更多是性能、成本、功耗的平衡,找到大模型在終端層面的“殺手級應用”。
汽車存儲所受到的限制相對小,因爲電池容量更大,對於降低能耗的要求尚不迫切,因此存儲無需太多改變。但段喜亭預計,汽車廠商與主機廠的價格戰可能會影響供應商的利潤空間,甚至有可能出現劣幣驅逐良幣的效應,使得存儲廠商沒有動力投入研發,導致行業進入到一個不健康的週期。
圖片系AI生成
存儲主控芯片如何演進
不止於大模型終端,存儲主控芯片也面臨着類似的問題,即如何兼顧性能、能耗和成本。
結合行業現狀來看,SSD主控芯片的門檻正變得越來越高,例如PCIe Gen4升級至5,吞吐量翻了一番,UFS(高端手機常用存儲)3.1到4.0,帶寬也翻了一倍,如果芯片廠商不從架構設計等方面做優化,能耗將成爲嚴重問題。
慧榮的存儲主控芯片由台積電代工,可以採用最新的先進製程,此外結合慧榮自己的設計,實現了在功耗增長不大的情況下,性能大幅提高。“在單位瓦數傳遞數據的速度越高,證明芯片的效能越好,這是AI時代存儲主控芯片一個很重要的衡量指標,我們可以做到比前代產品提高約30%以上的效能水平。”段喜亭說。
在芯片架構方面,存儲主控芯片此前多采用Arm架構,但隨着RISC-V架構的興起,行業內也出現了多款基於RISC-V架構的芯片。
對此,段喜亭認爲,大模型成爲行業發展的一個分水嶺。在大模型時代之前,RISC-V來勢洶洶,它沒有太多歷史包袱,成本相對較低且容易獲得,更重要的是不在美國製裁的範圍內,Arm架構好處是成熟穩定,有完善的生態系統,但是成本相對較高,因此RISC-V對Arm產生了一定程度的衝擊。
大模型時代,Arm架構迅速將AI特性融入到產品中,Arm的客戶群體也由此擴大,而RISC-V的開源路線會造成一個缺點,在產業變革的時候反應會變慢。目前RISC-V的市場聲量不高,RISC-V的發展趨勢有所放緩,行業也在思考在RISC-V芯片中加入AI功能的想象空間。
談及國內存儲廠商發展,段喜亭表示,前幾年國內存儲廠商如雨後春筍般湧現,如今收斂到有限的幾家企業,發展好的已經上市,其中的關鍵是找準自己的定位。
“對國內的初創公司,我們都希望他們成功,能夠站穩腳跟的創業存儲廠商,一開始就對自己有清楚的定位,不是盲目投資做高大上,但是不重視收益回報,我們歡迎這樣的廠商,一起把市場做大,大家都有自己在行業內的角色,而不是把市場弄得很卷。”(本文首發於鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達)