share_log

英伟达下一代GPU,我所知道的全在这了

英偉達下一代GPU,我所知道的全在這了

半導體行業觀察 ·  01/04 10:03

(原標題:英偉達下一代GPU,我所知道的全在這了)

如果您希望可以時常見面,歡迎標星收藏哦~

來源:內容編譯自tomshardware,謝謝。

下一代 Nvidia Blackwell GPU 架構和 RTX 50 系列 GPU 即將問世,基本符合計劃。雖然 Nvidia 官方沒有透露太多消息,但在過去的一個月裏,我們看到該公司圍繞數字 50 發佈了大量的營銷材料。一切看起來都有望在CES上發佈,很可能是在 1 月 6 日首席執行官黃仁勳的主題演講中。我們預計各種 Blackwell GPU 將加入最佳顯卡的行列,取代即將成爲上一代的產品。

當我們在 2024 年初與一些人交談時,他們預計到 2024 年假期到來時,我們至少會看到 RTX 5090 和 RTX 5080。但隨後Blackwell B200 的推遲以及包裝問題,這似乎推遲了事情的發生。現在,我們正在關注 2025 年 1 月的公告,該月底之前至少會有一兩種型號推出,也許會有多達四種不同的臺式機卡——筆記本電腦 RTX 50 系列也有可能。Nvidia 已經提供了其數據中心 Blackwell B200 GPU的許多核心細節。AI 和數據中心變體將不可避免地與消費者部件有所不同,但過去的消費者和數據中心 Nvidia GPU 之間有一些共同點,而且這種情況應該會繼續下去。這爲未來 RTX 50 系列 GPU 的某些方面提供了一些很好的跡象。仍有許多未知數,包括硬規格和定價細節。後者可以在最後一刻更改,因此任何定價「泄露」都很可能只是瞎猜,而不是實際信息。另一方面,規格現在應該已經確定,特別是如果我們要在 1 月底之前看到零售可用性的話。讓我們來了解各種謠言和細節,包括發佈日期、潛在規格和其他技術。

Blackwell 和 RTX 50 系列發佈日期

在所有未知數中,發佈日期(至少對於首批 Blackwell GPU 而言)可能是最容易確定的,尤其是現在。儘管我們個人在 2024 年初就聽說了,但 RTX 50 系列預計將於 2025 年 1 月發佈,並在 CES 2025 上亮相。這是一個延遲,但有充分的理由。Nvidia的數據中心 Blackwell B100/B200 GPU 遇到了封裝問題,也被推遲了。考慮到數據中心部門在過去一年中賺了多少錢(參見Nvidia 的最新收益),投入更多資金和晶圓來準備和提供 B200 是有意義的。遊戲玩家?是的,我們不再是 Nvidia 的首要任務。

這意味着根據歷史先例,消費者 Blackwell GPU 已經「遲到了」。Ada Lovelace RTX 40 系列 GPU於 2022 年 10 月首次亮相。Ampere RTX 30 系列 GPU於 2020 年 9 月首次亮相。在此之前,RTX 20 系列於兩年前的 2018 年 9 月推出,GTX 10 系列於 2016 年 5 月/6 月推出,GTX 900 系列於 2014 年 9 月推出。這意味着,每兩年就會有新的 Nvidia GPU 架構問世,整整十年如此。即便如此,我們也只比正常節奏晚了幾個月。

這不僅僅是關於兩年的消費級 GPU 節奏。Nvidia於 2022 年 3 月在其年度 GPU 技術大會 (GTC) 上首次披露了Hopper H100 架構的核心細節,Ada Lovelace 將於 2024 年 10 月發佈。2020 年 5 月,它首次發佈了Ampere A100 架構,幾個月後又發佈了消費者版本。2018 年也發生了同樣的事情,當時推出了 Volta V100 和 Turing,2016 年推出了Tesla P100和 Pascal。

因此,在過去四代中,我們首先了解了數據中心和 AI GPU,大約六個月後才發佈並推出消費者 GPU。Nvidia 發佈了Blackwell B200 架構,如果不是因爲那個討厭的 CoWoS 封裝問題,我們可以肯定地說,我們會在 2024 年秋季聽到有關消費者版本的消息。

隨着 Blackwell B200 的完整上市推遲到 2025 年,其他所有產品也都推遲了。人工智能工作負載和銷售正在蓬勃發展,一些地方搶購了數十萬個 Nvidia GPU。這些產品的利潤率遠遠超過任何消費級產品,不過我們仍然可能會看到專業級和數據中心級顯卡使用與消費級型號相同的 GPU。

我們不知道Nvidia 計劃爲下一代 Blackwell 部件提供確切的名稱或型號,但我們確信我們將擁有 RTX 5090、RTX 5080、RTX 5070 和 RTX 5060 卡,以及可能是 Ti 和/或 Super 變體的某種組合。毫無疑問,其中一些變體將在首次發佈後約一年的中期更新期間推出。我們也很好奇 Nvidia 是否會有 RTX 5050 GPU——它在 40 系列和 20 系列的臺式機 GPU 上跳過了這一級別,儘管後者有 GTX 1660 和 1650 級 GPU。

頂級 RTX 5090 和 5080 應該會率先於 2025 年 1 月上市。有傳言稱我們還可能會看到 RTX 5070 Ti 和 RTX 5070,不過它們是否會在 CES 主題演講期間正式亮相還有待觀察。5060 級硬件可能會在首批 50 系列 GPU 推出後的未來六個月內隨時推出。與往常一樣,我們預計 Blackwell GPU 將遵循典型的交錯發佈時間表。

台積電4NP,精煉4nm Nvidia

GTC 2024 上一個令人驚訝的公告是,Blackwell B200 將使用台積電 4NP 節點——「4nm Nvidia Performance」,或者基本上是 RTX 40 系列上使用的 N4 節點的調整/微調版本。雖然工藝名稱已經與物理特性基本脫節,但許多人預計 Nvidia 將轉向台積電尖端 N3 工藝技術的變體。相反,它選擇改進現有的 4N 節點,該節點在過去兩年中已用於 Hopper 和 Ada Lovelace GPU。

走這條路肯定會節省一些成本,儘管台積電沒有披露與其各個合作伙伴的合同定價協議。Blackwell B200 還使用雙芯片解決方案,兩個相同的芯片通過 10 TB/s NV-HBI(Nvidia 高帶寬接口)連接。也許 Nvidia 只是認爲這一代不需要轉向 3nm 級節點。

然而,這爲 AMD 甚至英特爾打開了大門,使其有可能轉向更新、更先進的工藝節點,將更高效的晶體管塞進更小的芯片中。Nvidia 對 RTX 30 系列採取了類似的方法,使用更便宜的三星 8N 工藝,而不是更新、更好的台積電 N7。目前尚不清楚即將推出的下一代 GPU 將如何發展,不過英特爾 Battlemage 至少似乎堅持使用落後節點工藝,因爲 Arc B580 使用台積電 N5——在很多方面都不如 RTX 40 系列先進。

仍有可能(直到主題演講發佈之前)雖然 Blackwell B200 變體使用台積電 4NP,但消費芯片可能會使用不同的節點。這裏有使用不同節點甚至製造商的先例,例如 Ampere A100 使用 TSMC N7,而 RTX 30 系列芯片使用三星 8N。但很有可能,所有 Blackwell GPU 都將使用 TSMC N4P。

下一代 GDDR7 內存

人們早就預料到,消費級和專業級(即嚴格來說並非數據中心級) Blackwell GPU 將轉向GDDR7 顯存。所有跡象都表明,GDDR7 將及時爲下一代 GPU 做好準備,並且全面生產正在順利進行中。三星和 SK 海力士在 GTC 2024 上展示了 GDDR7 芯片,美光證實 GDDR7 也在生產中。

當前一代 RTX 40 系列 GPU 使用 GDDR6X 和 GDDR6 顯存,主頻從 17Gbps 到 23Gbps。GDDR7 的目標速度高達 36Gbps,比 GDDR6X 高 50%,比普通 GDDR6 高 80%。SK 海力士表示它甚至會有 40Gbps 芯片,儘管尚未給出這些芯片可能上市的具體時間表。無論如何,GDDR7 將在各個級別提供急需的內存帶寬提升。

Nvidia 不太可能真正推出內存頻率爲 36Gbps 的顯卡。過去,它使用 24Gbps GDDR6X 芯片,但頻率爲 22.4Gbps 或 23Gbps——在我們測試的各種 RTX 4090 顯卡中,一些 24Gbps 的 Micron 芯片顯然被降頻至 21Gbps。目前有跡象表明,RTX 5090 的 GDDR7 頻率將達到 28Gbps,而 RTX 5080 可能會選擇更高的內存速度,達到 32Gbps 或更高。無論哪種方式,這仍然是帶寬的一個健康提升。

在 28Gbps 下,與 RTX 4090 上使用的 21Gbps GDDR6X 相比,GDDR7 內存將提供 33% 的顯存帶寬提升。如果我們的預測正確,並且 RTX 5080 選擇 32Gbps GDDR7,那麼與 RTX 4080 Super 相比,帶寬同樣將增加 39%,與原始 4080 的 22.4Gbps 內存相比,帶寬將增加 43%。與 Blackwell 的許多其他方面一樣,Nvidia 及其合作伙伴將推動其發展到何種程度還有待觀察。

我們還預計 Nvidia 將繼續在 Blackwell 中使用大型 L2 緩存。這將提供更有效的內存帶寬——每次緩存命中都意味着不需要進行內存訪問。以 50% 的緩存命中率爲例,這將使有效內存帶寬翻倍,但請注意,命中率因遊戲和設置而異,尤其是更高的分辨率會降低命中率。

GDDR7 還可能解決內存容量與接口寬度的問題。在 GTC 上,我們被告知 16Gb 芯片(2GB)正在生產中,24Gb(3GB)芯片也即將推出。容量非 2 的更大芯片是否已爲即將推出的 Blackwell GPU 做好準備?至少有傳言稱 Nvidia 可能會推出16GB(2GB 芯片)和 24GB(3GB 芯片)版本的 RTX 5080。只要價格差異不是太大,其他規格保持不變,這不是一個壞方法。基本型號可能配備 2GB 芯片,而升級版本可能配備 3GB 芯片,VRAM 容量增加 50%。

目前,消費級顯卡並不急需超過 24GB 的內存。但據稱 RTX 5090 具有 512 位接口,這意味着它將採用默認的 32GB 配置,未來可能會提供 48GB 版本。容量更大的 GDDR7 芯片可能對專業和 AI 專用顯卡特別有益,因爲大型 3D 模型和 LLM 在這些領域越來越常見。512 位接口,PCB 兩側均有 3GB 芯片,可以產生具有 96GB 內存的專業 RTX 6000 Blackwell Generation。

更重要的是,24Gb 芯片的推出意味着 Nvidia(以及 AMD 和英特爾)可以在 192 位接口上放置 18GB VRAM,在 128 位接口上放置 12GB,在 96 位接口上放置 9GB,所有 VRAM 都位於 PCB 的一側。我們還可以看到 256 位接口的 24GB 顯卡,以及 384 位接口的 36GB 顯卡——專業顯卡的容量是這個數字的兩倍。定價肯定會影響 VRAM 容量,但我們更有可能在消費級 GPU 上看到 24GB GDDR7 內存芯片,而不是「是否」的問題。

Blackwell 架構更新

Blackwell 架構幾乎肯定會包含上一代 Ada Lovelace 架構的各種更新和增強,但現在我們確切知道的內容可以用兩個詞來概括:不多。但每一代 Nvidia GPU 都至少包含一些架構升級,我們可以期待這一輪也會出現同樣的情況。

我們確實知道數據中心 Blackwell B200 GPU 再次重新設計了張量核心,爲 FP4 和 FP6 數值格式提供原生支持。這些將主要用於 AI 推理,考慮到消費級 GPU 將與專業卡一起承擔雙重任務,可以肯定所有 Blackwell 芯片也將支持 FP4 和 FP6。(作爲相關示例,Ada 在其張量核心中添加了與 Hopper 相同的 FP8 支持。)

Nvidia 在每一代 RTX 中都提高了潛在的光線追蹤性能,而 Blackwell 似乎可能會延續這一趨勢。隨着《心靈殺手 2》和《賽博朋克 2077》等更多遊戲推動全路徑追蹤——更不用說模組製作者可能使用RTX Remix來增強具有全路徑追蹤功能的舊 DX10 時代遊戲——對更高光線追蹤吞吐量的需求也隨之增加。可能還會有其他以 RT 爲中心的更新,就像 Ada 提供的 SER(着色器執行重新排序)、OMM(不透明度微圖)和 DMM(位移微網格)一樣。但這些變化可能是什麼目前尚不清楚。

Blackwell還會帶來哪些其他架構變化?如果我們正確地認爲 Nvidia 堅持使用 TSMC 4NP 作爲消費級部件,我們預計不會有大規模的改動。仍然會有一個大的 L2 緩存,用於 DLSS 3 幀生成的增強型 OFA(光流加速器)當然會保留。它很可能也會進行一些調整以改進它,有傳言稱我們可以在 RTX 50 系列中獲得DLSS 4「神經渲染」。請注意,Nvidia 之前曾將 DLSS 升級和幀生成都稱爲「神經渲染」,因此我們需要拭目以待。

對於圖形和更一般的工作負載,原始計算幾乎肯定會大幅增加,但可能更接近 30% 的提升,而不是 50% 或更大的提升。例如,RTX 4080 提供 40 TeraFLOPS 的 FP32 計算,而 3080 爲 30 TeraFLOPS,增幅爲 33%,而 4090 提供 83 TeraFLOPS,而 3090 爲 40 TeraFLOPS,增幅高達 107%。也許 Nvidia 也會在 RTX 5090 上「大展宏圖」,同時在其他方面做出較小的改進,我們很快就會發現答案。

RTX 50 系列定價

RTX 50 系列 GPU 的價格是多少?坦率地說,考慮到目前的市場狀況,幾乎沒有理由指望 Nvidia 會降低相對於當前 RTX 40 系列 GPU 的價格。Nvidia 會將這些顯卡的價格定得儘可能高,只要它認爲市場可以接受。由於 AI 性能可能更高,而且非遊戲領域的需求增加,如果下一代顯卡的定價結構與當前一代相同,我們可能會很幸運。

我們希望代際定價不會上漲,但這種希望可能落空了。「降級」 RTX 4080 Super 售價 1,000 美元意味着特定級別的 GPU 現在比 RTX 2080 Super 時代貴了 43%。

當然,中間還有「699 美元」的 RTX 3080 10GB 和「1,199 美元」的 RTX 3080 Ti,當時由於 GPU 加密挖礦的盛行以及 Covid-19 的影響,價格出現了各種混亂。值得慶幸的是,雖然目前使用 GPU 挖掘某些加密貨幣在技術上是有利可圖的,但WhatToMine估計 RTX 4090 的收入遠低於每天 1 美元——這意味着按照目前的速度和價格,需要十年以上才能收支平衡。(沒有人應該這樣做,因爲 GPU 更有可能在收支平衡之前就死掉。)

預算 GPU 行業也基本消亡了。集成顯卡已經達到了「足夠快」的程度,可以滿足大多數常見工作負載,甚至包括適度的遊戲——對於移動處理器來說尤其如此,而桌面選項通常要弱得多。上一代真正瞄準預算領域的新 GPU 是 AMD 相當不起眼的RX 6500 XT和RX 6400——自2019 年推出GTX 1650 Super以來,Nvidia 還沒有生產過一款低於 200 美元的新 GPU (除非你想算上GTX 1630的悲劇)。

這意味着對於專用的臺式機顯卡,我們現在生活在這樣一個世界裏:「預算」意味着 300 美元左右,「主流」意味着 400-600 美元,「高端」是指售價 800 至 1,000 美元的 GPU,而「發燒友」部分的目標是 1,500 美元或更高。或者至少,這似乎是 Nvidia 對這種情況的看法。AMD 的 GPU 往往更實惠一些,尤其是從市場價格來看,但 Nvidia 至少在過去四年裏一直保持着較高的定價結構。

Blackwell GPU 上市後價格會好壞參半嗎?如果所有產品的價格都比上一代產品高,請不要感到驚訝,尤其是帶有工廠超頻功能的定製 AIB 合作伙伴型號。未來幾個月價格是否保持高位可能在很大程度上取決於 AI 泡沫是否破裂。如果對 AI 的需求持續增長,那麼 RTX 5090 的價格降至 2 美元也不足爲奇。499——與舊款Titan RTX一樣。

鑑於我們迄今爲止所說的一切,希望可以清楚的是,目前還沒有關於 Blackwell 的任何官方信息。2022年的 Nvidia 黑客攻擊給了我們 Blackwell 這個名字和一些潛在的代號,但那是兩年多前的事了,這段時間裏很多事情都可能發生變化。此外,關於 Blackwell 的細節一開始就很少。但現在距離所謂的發佈還有幾周的時間,泄密事件也變得更加具體。

這是我們更新的推測規格表,其中包含適當的名稱和規格。官方公告尚未確定任何事情,但下個月推出的任何產品都可能與我們在此處展示的非常相似,我們也會在 GPU 正式發佈後更新表格。

半導體精品公衆號推薦

專注半導體領域更多原創內容

關注全球半導體產業動向與趨勢

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》爲您分享的第3996期內容,歡迎關注。

『半導體第一垂直媒體』

實時 專業 原創 深度

公衆號ID:icbank

喜歡我們的內容就點「在看」分享給小夥伴哦

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論