與 H100 相比,最強大的中國專用 AI 芯片 H20 的性能如何?
幾乎可以肯定的是,所有三個 AI 芯片都是 H100 的「化」或「縮小」版本,反映了符合出口控制所做的調整。其中,H20 AI 晶片具有 96GB 的 HBM3 存儲空間,記憶體頻寬高達 4.0 TB/s,比 H100 高,但綜合計算能力只有 296 TFLOP,性能密度 2.9,遠低於 H100。
在特定性能指標方面,H20 AI 芯片是 H100 的一種調整版本。根據測量組織的說法,與 H100 相比,H20 的綜合算術功率低約 80%。此變化反映了芯片的性能調整,以滿足與美國出口控制政策相關的要求。儘管如此,H20 仍然在特定情況下提供性能優勢。例如,通過將推論所需的晶片數從兩個降低為一個,並且如果然後使用 8 位元量化,LLAMA 70B 模型可以在單一 H20 上有效地執行,而不需要兩個 H100。這表明 H20 仍可在某些應用場景中提供有效性能。
從傳統的算術角度來看,H20 是從 H100 降級,但在 LLM 推論的這一方面,H20 實際上將比 H100 快 20% 以上,因為 H20 在某些方面與 H200 相似,該原因將於 2024 年發布。請注意,H200 是 H100 的繼承者,專注於用於複雜的 AI 和 HPC 工作負載的超高效能晶片。因此,NVIDIA 的 H20 AI 芯片是為響應美國對中國的出口控制政策而推出,與 H100 相比,其性能已降低,但在某些應用場景中仍保持一定水平的效率和實用性。
NVIDIA 和其他大型科技巨頭計劃在本週拉斯維加斯的消費電子展(CES)上揭露他們的最新發展。該公司預計將在活動上展示其幾個最新 GPU,包括 RTX 4080 Super、4070 Ti Super 和 4070 Super。分析師通常預期 NVIDIA 將傾向於保持其在全球遊戲硬件領域的絕對領導地位。 $英偉達(NVDA.US$ $美國超微公司(AMD.US$
免責聲明:社區由Moomoo Technologies Inc.提供,僅用於教育目的。
更多信息
評論
登錄發表評論
K1 Tree Bark :
我覺得買家不會賣書...
望月崇凉 : 中國互聯網巨頭公司對H20不感興趣