Blackwell太搶手令客戶關係緊張
黃仁勳一席話,讓資本市場風雲再起。
美股市場在經歷了盤初的短暫低迷後,上演了一場驚心動魄的V型大反轉,最終三大指數集體收漲,納指更是以2.17%的漲幅,創下了自8月16日以來的最大單日漲幅。
這場逆轉的幕後推手,除了市場的自我調整,更離不開英偉達等科技巨頭的強勁表現,以及市場對於聯儲局加息預期的微妙變化。
英偉達在美股早盤一度小幅轉跌下逼107美元,隨後伴隨着黃仁勳的講話漲幅不斷擴大,到尾盤時仍在不斷刷新日高,最高漲8.4%一度升破117美元。
最終英偉達收漲8.15%%創六週最大漲幅,市值在短短一夜之間暴漲了驚人的2161億美元(約合人民幣1.54萬億元)。
在英偉達的帶動下,半導體板塊普漲,ARM漲超10%,博通漲超6%,台積電、美光漲超4%。
黃仁勳:Blackwell太搶手,有能力從台積電轉單!
CEO黃仁勳在高盛集團一場會議上表示,英偉達的產品現已成爲科技界最搶手的商品,客戶對有限的供應爭相競爭,尤其是AI芯片Blackwell供應的增速有限,導致一些客戶感到沮喪。
他還暗示,若有必要,英偉達會減少對臺積電的依賴,轉向其他芯片製造供應商。
他告訴觀衆,“我們產品需求非常強勁,每個人都想要成爲第一個收到貨的,每個人都想收到最多的產品。我們今天可能有更多情緒化的客戶,這也是情有可原的。關係很緊張,但我們正盡力做到最好。”
黃仁勳表示,公司最新芯片「Blackwell」(號稱「最強AI芯片」)尤受歡迎,供應商正努力滿足需求。
當黃仁勳被問到,巨大的AI支出是否爲客戶帶來了投資回報時,黃仁勳表示,企業別無選擇,只能接受「加速計算」。
他解釋說,英偉達的技術不僅能加速傳統的工作負載——數據處理,還能處理舊技術無法應對的AI任務。
黃仁勳還表示,英偉達在芯片生產方面嚴重依賴台積電,這是因爲台積電在芯片製造航瑜中遙遙領先。
但他也表示,如果需要,英偉達可以轉向其他供應商,因爲我們已經做了兩手準備,英偉達在內部開發了大部分技術。
然而,他表示,這樣的改變可能會導致其芯片質量的下降。“台積電的敏捷性和他們響應我們需求的能力實在是令人難以置信。
此外,美國政府正在考慮允許英偉達向沙特阿拉伯出口先進芯片。消息發佈後,英偉達股價大幅上漲,今年以來漲幅已超過一倍。
附:英偉達黃仁勳對話高盛全文(中文梳理版)
1. 首先談談31年前,你創立公司時的一些想法。從那時起,你將公司從一個專注於遊戲的GPU公司轉型爲一個爲數據中心行業提供廣泛硬件和軟件的公司。你能不能先談談這個歷程?當你開始時,你在想什麼?它是如何演變的?你未來的關鍵優先事項是什麼,以及你如何看待未來的世界?
黃仁勳:我想說,我們做對的一件事是,我們預見到未來會有另一種計算形式,它可以增強通用計算,解決通用工具永遠無法解決的問題。這種處理器一開始會做一些對CPU來說極其困難的事情,那就是計算機圖形處理。
但我們將逐步擴展到其他領域。我們選擇的第一個領域當然是圖像處理,這與計算機圖形處理是互補的。我們將其擴展到物理模擬,因爲在我們選擇的視頻遊戲領域中,你不僅希望它美觀,還希望它動態化,能夠創建虛擬世界。我們一步一步地擴展,並將其引入科學計算。第一個應用之一是分子動力學模擬,另一個是地震處理,這基本上是逆物理。地震處理與CT重建非常相似,是另一種形式的逆物理。所以我們一步一步地解決問題,擴展到相鄰行業,最終解決了這些問題。
我們一直堅守的核心理念是加速計算能夠解決有趣的問題。我們的架構保持一致,意味着今天開發的軟件可以在你留下的大量已安裝基礎上運行,過去開發的軟件可以通過新技術加速。這種關於架構兼容性的思維方式、創建大量已安裝基礎、與生態系統共同發展的心理從1993年就開始了,我們一直延續到今天。這就是爲什麼英偉達的CUDA擁有如此龐大的已安裝基礎的原因,因爲我們一直在保護它。保護軟件開發者的投資是我們公司自始至終的首要任務。
保護軟件開發者的投資是我們公司自始至終的首要任務。展望未來,我們在一路上解決的一些問題,當然包括學習如何成爲創始人、如何成爲首席執行官、如何經營業務、如何建立公司,這些都是新的技能。這有點像發明現代計算機遊戲行業。人們可能不知道,但英偉達是世界上最大的視頻遊戲架構的安裝基礎。GeForce擁有大約3億玩家,仍然在快速增長,非常活躍。所以我認爲,每次我們進入一個新市場時,我們都需要學習新的算法、市場動態,創建新的生態系統。
我們需要這樣做的原因是,與通用計算機不同,通用計算機一旦構建好處理器,所有的東西最終都會運行。但我們是加速計算機,這意味着你需要問自己,你要加速什麼?不存在所謂的通用加速器。
2. 深入談談一般用途和加速計算之間的差異?
黃仁勳:如果你看看現在的軟件,你寫的軟件中有大量的文件輸入輸出,有設置數據結構的部分,還有一些魔法般的算法核心。這些算法不同,取決於它們是用於計算機圖形處理、圖像處理還是其他什麼。它可以是流體、粒子、逆物理或者圖像領域的東西。所以這些不同的算法都是不同的。如果你創建一個處理器,專門擅長這些算法,並補充CPU處理它擅長的任務,那麼理論上,你可以極大地加速應用程序的運行。原因是通常5%到10%的代碼佔據了99.99%的運行時間。
因此,如果你把那5%的代碼卸載到我們的加速器上,技術上,你可以將應用程序的速度提高100倍。這並不罕見。我們經常可以將圖像處理加速500倍。現在我們做的是數據處理。數據處理是我最喜歡的應用之一,因爲幾乎所有與機器學習相關的內容都在演進。它可以是SQL數據處理、Spark類型的數據處理,或者是向量數據庫類型的處理,處理無結構或結構化的數據,這些數據都是數據幀。
我們對這些進行極大的加速,但爲了做到這一點,你需要創建一個頂級的庫。在計算機圖形處理領域,我們很幸運有了Silicon Graphics的OpenGL和Microsoft的DirectX,但在這些之外,沒有真正存在的庫。因此,舉個例子,我們最著名的一個庫是與SQL類似的庫。SQL是存儲計算的庫,我們創建了一個庫,它是世界上第一個神經網絡計算庫。
我們有cuDNN(用於神經網絡計算的庫),還有cuOpt(用於組合優化的庫),cuQuantum(用於量子模擬和仿真的庫),以及很多其他的庫,比如用於數據幀處理的cuDF,類似於SQL的功能。因此,所有這些不同的庫都需要被髮明出來,它們可以把應用程序中的算法重新整理,使我們的加速器能夠運行。如果你使用這些庫,你就可以實現100倍的加速,獲得更多的速度,非常驚人。
因此,概念很簡單,而且非常有意義,但問題是,你如何去發明這些算法,並讓視頻遊戲行業使用它們,編寫這些算法,讓整個地震處理和能源行業使用它們,編寫新的算法並讓整個AI行業使用它們。你明白我的意思嗎?因此,所有這些庫,每一個庫,首先我們必須完成計算機科學的研究,其次,我們必須經歷生態系統的開發過程。
我們必須去說服每個人使用這些庫,然後還要考慮它們運行在哪些類型的計算機上,每種計算機都不一樣。因此,我們一步一步地進入一個領域又一個領域。我們爲自動駕駛汽車創建了一個非常豐富的庫,爲機器人開發了一個非常出色的庫,還有一個令人難以置信的庫,用於虛擬篩選,無論是基於物理的虛擬篩選還是基於神經網絡的虛擬篩選,還有一個令人驚歎的庫用於氣候技術。
我們必須去結交朋友,創建市場。事實證明,英偉達真正擅長的事情是創建新的市場。我們現在已經做了這麼久,以至於英偉達的加速計算似乎無處不在,但我們確實必須一步步地完成,一次一個行業地開發市場。
3. 現場的許多投資者非常關注數據中心市場,能否分享一下你對中長期機會的看法?顯然,你的行業推動了你所稱的「下一次工業革命」。你如何看待數據中心市場的現狀以及未來的挑戰?
黃仁勳:有兩件事同時在發生,它們經常被混爲一談,分開討論有助於理解。首先,我們假設沒有AI存在的情況下。在沒有AI的世界裏,通用計算已經停滯不前了。大家都知道,半導體物理學中的一些原理,比如摩爾定律、Denard縮放等,已經結束了。我們不再看到CPU的性能每年翻倍的現象。我們已經很幸運了,能在十年內看到性能翻倍。摩爾定律曾經意味着五年內性能提升十倍,十年內提升一百倍。
然而現在這些已經結束了,所以我們必須加速一切能加速的東西。如果你在做SQL處理,加速它;如果你在進行任何數據處理,加速它;如果你在創建一個互聯網公司並擁有推薦系統,必須加速它。如今最大的推薦系統引擎已經全部加速了。幾年前這些還在CPU上運行,而現在已經全部加速了。因此,第一個動態是,全世界價值數萬億美元的通用數據中心將會現代化,轉變爲加速計算的數據中心。這是不可避免的。
此外,因爲英偉達的加速計算帶來了如此巨大的成本降低,過去十年中,計算能力不是以100倍,而是以100萬倍的速度增長。那麼問題來了,如果你的飛機能快一百萬倍,你會做什麼不同的事情呢?
因此,人們突然意識到:「爲什麼我們不讓計算機來編寫軟件,而不是我們自己去想象這些功能,或者我們自己去設計算法呢?」我們只需要把所有的數據、所有的預測性數據交給計算機,讓它去找出算法——這就是機器學習,生成式AI。因此,我們在許多不同的數據領域大規模應用了它,計算機不僅知道如何處理數據,還理解數據的含義。因爲它同時理解多種數據模式,它可以進行數據翻譯。
因此,我們可以從英文轉換爲圖像,從圖像轉換爲英文,從英文轉換爲蛋白質,從蛋白質轉換爲化學物質。因爲它理解了所有的數據,因此可以進行所有這些翻譯過程,我們稱之爲生成式AI。它可以將大量的文字轉換爲少量的文字,或者將少量的文字擴展爲大量的文字,等等。我們現在正處於這個計算機革命的時代。
而現在令人驚訝的是,第一批價值數萬億美元的數據中心將被加速,並且我們還發明瞭這種新型的軟件,稱爲生成式AI。生成式AI不僅僅是一種工具,它是一種技能。正是因爲這個原因,新的行業正在被創造出來。
這是爲什麼?如果你看看直到現在的整個IT行業,我們一直在製造人們使用的工具和儀器。而第一次,我們正在創造出能夠增強人類能力的技能。因此,人們認爲AI將超越價值數萬億美元的數據中心和IT行業,進入技能的世界。
那麼,什麼是技能呢?比如數字貨幣是一種技能,自動駕駛汽車是一種技能,數字化的裝配線工人,機器人,數字化的客戶服務,聊天機器人,數字化的員工爲英偉達規劃供應鏈。這可以是一個SAP的數字代理。我們公司大量使用ServiceNow,我們現在擁有了數字員工服務。因此,我們現在擁有了這些數字化的人類,這就是我們現在正處的AI浪潮。
4. 金融市場中存在一個持續的辯論,即隨着我們繼續建設AI基礎設施,投資回報是否足夠?你如何評估客戶在這個週期中獲得的投資回報率?如果你回顧歷史,回顧PC和雲計算,它們在類似的採用週期中,回報率如何?與現在相比有什麼不同?
黃仁勳:這是個非常好的問題。讓我們來看看。在雲計算之前,最大的趨勢是虛擬化,如果大家還記得的話。虛擬化基本上意味着我們將數據中心中的所有硬件虛擬化爲虛擬數據中心,然後我們可以跨數據中心移動工作負載,而不必直接與特定的計算機相關聯。結果是,數據中心的利用率提高了,我們看到了數據中心成本減少了兩倍到兩倍半,幾乎是在一夜之間完成的。
接着,我們將這些虛擬計算機放到雲中,結果是,不僅僅是一家公司,很多公司都可以共享相同的資源,成本再次下降,利用率再次提高。
這些年的所有進步,掩蓋了底層的根本變化,那就是摩爾定律的終結。我們從利用率提升中獲得了兩倍、甚至更多的成本降低,然而這也碰到了晶體管和CPU性能的極限。
接着,所有的這些利用率的提升已經達到極限,這也是爲什麼我們現在看到數據中心和計算通脹的原因。因此,第一件正在發生的事情就是加速計算。因此,當你在處理數據時,比如使用Spark——這是當今世界上使用最廣泛的數據處理引擎之一——如果你使用Spark並通過英偉達加速器加速它,你可以看到20倍的加速。這意味着你會節省10倍的成本。
當然,你的計算成本會上升一點,因爲你需要支付英偉達GPU的費用,計算成本可能會增加一倍,但你將減少計算時間20倍。因此,你最終節省了10倍的成本。而這樣的投資回報率對於加速計算來說並不罕見。因此,我建議你加速一切可以加速的工作,然後使用GPU進行加速,這樣可以立即獲得投資回報。
除此之外,生成式AI的討論是當前AI的第一波浪潮,基礎設施玩家(比如我們自己和所有云服務提供商)將基礎設施放在雲上,供開發人員使用這些機器來訓練模型、微調模型、爲模型提供保護等等。由於需求如此之大,每花費1美元在我們這裏,雲服務提供商可以獲得5美元的租金回報,這種情況正在全球範圍內發生,一切都供不應求。因此,對這種需求的需求非常巨大。
我們已經看到的一些應用,當然包括一些知名的應用,比如OpenAI的ChatGPT、GitHub的Copilot,或者我們公司內部使用的共同生成器,生產力提升是不可思議的。我們公司裏的每一個軟件工程師現在都使用共同生成器,不管是我們自己爲CUDA創建的生成器,還是用於USD(我們公司使用的另一種語言),或者Verilog、C和C++的生成器。
因此,我認爲每一行代碼都由軟件工程師編寫的日子已經徹底結束了。未來,每一個軟件工程師都將有一個數字工程師伴隨在身邊,24/7隨時協助工作。這就是未來。因此,我看英偉達,我們有32000名員工,但這些員工周圍將有更多的數字工程師,可能會多100倍的數字工程師。
5. 很多行業都在接受這些變化。哪些用例、行業是你最興奮的?
黃仁勳:在我們公司,我們在計算機圖形學方面使用AI。如果沒有人工智能,我們無法再進行計算機圖形學。我們只計算一個像素,然後推測其餘的32個像素。也就是說,我們在某種程度上「幻想」出其餘的32個像素,它們在視覺上是穩定的,看起來是照片級真實的,圖像質量和性能都非常出色。
計算一個像素需要大量的能量,而推測其他32個像素的能量需求則非常少,而且可以非常快速地完成。因此,AI並不僅僅是訓練模型,這只是第一步。更重要的是如何使用模型。當你使用模型時,你會節省大量的能量和時間。
如果沒有AI,我們無法爲自動駕駛汽車行業提供服務。如果沒有AI,我們在機器人技術和數字生物學領域的工作也是不可能的。現在幾乎每一個科技生物公司都以英偉達爲中心,他們正在使用我們的數據處理工具來生成新蛋白質,小分子生成、虛擬篩選等領域也將因爲人工智能而被徹底重塑。
6. 談談競爭和你們的競爭壁壘吧。目前有很多公私公司希望能打破你們的領導地位。你如何看待你們的競爭壁壘?
黃仁勳:首先,我認爲有幾件事讓我們與衆不同。第一點要記住,AI並不僅僅是關於芯片的。AI是關於整個基礎設施的。如今的計算機不是製造一塊芯片然後人們購買它並放入計算機中。那種模式屬於上世紀90年代。如今的計算機是以超級計算集群、基礎設施或超級計算機爲名開發的,這不是一塊芯片,也不完全是計算機。
所以,我們實際上是在構建整個數據中心。如果你去看一下我們其中一個超級計算集群,你會發現管理這個系統所需的軟件是非常複雜的。並沒有一個「Microsoft Windows」可以直接用於這些系統。這種定製化的軟件是我們爲這些超級集群所開發的,所以設計芯片的公司、構建超級計算機的公司以及開發這些複雜軟件的公司,理所當然的是同一家公司,這樣可以確保優化、性能和效率。
其次,AI本質上是一種算法。我們非常擅長理解算法的運作機制,並且了解計算堆棧如何分佈計算,以及如何在數百萬個處理器上運行數天,保持計算機的穩定性、能源效率以及快速完成任務的能力。我們在這方面非常擅長。
最後,AI計算的關鍵是安裝基礎(installed base)。擁有跨所有云計算平台和內部部署(on-premise)的統一架構非常重要。無論你是在雲中構建超級計算集群,還是在某台設備上運行AI模型,都應該有相同的架構以運行所有相同的軟件。這就是所謂的安裝基礎。而這種自1993年以來的架構一致性是我們能夠取得今天成就的關鍵原因之一。
因此,今天如果你要創辦一家AI公司,最明顯的選擇就是使用英偉達的架構,因爲我們已經遍佈所有的雲平台,不論你選擇哪臺設備,只要它有英偉達的標識,你就可以直接運行相同的軟件。
7. Blackwell在訓練上快了4倍,推理速度比它的前代產品Hopper快了30倍。你們的創新速度如此之快,你們能否保持這樣的節奏?你們的合作伙伴能否跟上你們的創新步伐?
黃仁勳:我們的基本創新方法是確保我們不斷推動架構創新。每個芯片的創新週期大約是兩年,在最好的情況下是兩年。我們每年還會對它們進行中期升級,但整體架構的革新大約是每兩年一次,這已經非常快了。
我們有七個不同的芯片,這些芯片共同作用於整個系統。我們可以每年推出新的AI超級計算集群,並且比上一代更強大。這是因爲我們擁有多個可以進行優化的部分。因此我們可以非常快速地交付更高的性能,並且這些性能的提升直接轉化爲總擁有成本(TCO)的下降。
Blackwell在性能上的提升意味着,對於擁有1千兆瓦電力的客戶,他們可以獲得3倍的收入。性能直接轉化爲吞吐量,吞吐量則轉化爲收入。如果你有1千兆瓦的電力可用,你可以獲得3倍的收入。
因此,這種性能提升的回報是無與倫比的,也無法通過芯片成本的降低來彌補這3倍的收入差距。
8. 如何看待對亞洲供應鏈的依賴?
黃仁勳:亞洲的供應鏈非常複雜並且高度互聯。英偉達的GPU不僅僅是一塊芯片,它是由成千上萬個組件組成的複雜系統,類似於一輛電動車的構造。因此,亞洲的供應鏈網絡非常廣泛且複雜。我們力求在每一個環節上設計出多樣性和冗餘性,確保即使出現問題,我們也能迅速將生產轉移到其他地方進行製造。總的來說,即使供應鏈出現中斷,我們也有能力進行調整,以確保供應的連續性。
我們目前在臺積電進行製造,因爲它是世界上最好的,不僅僅是好一點點,而是好得多。我們與他們有着長期的合作歷史,他們的靈活性和規模能力都令人印象深刻。
去年,我們的收入出現了大幅增長,這離不開供應鏈的快速反應。台積電的敏捷性以及他們滿足我們需求的能力是非常了不起的。在不到一年的時間裏,我們大幅提升了產能,並且我們明年將繼續擴大,後年還要進一步擴大。因此,他們的敏捷性和能力都很出色。不過,如果有需要,我們當然也可以轉向其他供應商。
9. 貴公司處於非常有利的市場位置。我們已經討論了很多非常好的話題。你最擔心的是什麼?
黃仁勳:我們的公司目前與全球每一家AI公司都有合作,也與每一家數據中心有合作。我不知道有哪家雲服務提供商或計算機制造商我們沒有合作的。因此,隨着這樣的規模擴展,我們肩負着巨大的責任。我們的客戶非常情緒化,因爲我們的產品直接影響他們的收入和競爭力。需求太大,滿足這些需求的壓力也很大。
我們目前正全面生產Blackwell,並計劃在第四季度開始發貨並進一步擴展。需求如此之大,每個人都希望能儘早拿到產品,獲取最多的份額。這種緊張和激烈的氛圍實在是前所未有。