Nvidia已停止开发GB200 NVL36*2(双机架72 GPU版本)🤔
分析师Ming-Chi Kuo表示:“Nvidia已终止GB200 NVL36*2(双机架72 GPU版本)的开发。虽然AI和Nvidia的长期趋势持续强劲,但产品计划频繁变更可能缓解短期交易情绪。”- Medium
未来,除非有定制需求,Nvidia将仅提供GB200 NVL72(以下简称NVL72)的单机架版本,双机架版本(NVL36*2)将被废弃。单机架的GB200 NVL36(以下简称NVL36)将维持最初的开发计划和发货计划。
该开发对AI和Nvidia的长期积极趋势没有影响。但短期内,一些市场参与者可能开始对Nvidia和供应链的执行能力产生疑问。
我认为Nvidia最近频繁更改AI服务器产品的路线图是为了在有限的资源下改善供应链执行、竞争优势和顾客需求的平衡(NVL36*2的开发终止是其中一个例子)。这显示Nvidia正在对产品计划采取更加实践的方法,但这种转变可能使一些市场参与者对供应链的变化感到困惑。
我认为Nvidia最近频繁更改AI服务器产品的路线图是为了在有限的资源下改善供应链执行、竞争优势和顾客需求的平衡(NVL36*2的开发终止是其中一个例子)。这显示Nvidia正在对产品计划采取更加实践的方法,但这种转变可能使一些市场参与者对供应链的变化感到困惑。
由于对Blackwell服务器2025年产品发货构成的可见性较低(数个月前,市场普遍认为只有NVL36、NVL72、NVL36*2),装配和冷却解决方案等一些供应商可能对2025年的展望产生重大影响。
2个72 GPU模型比较:选择NVL 72的原因以及删除NVL 36的原因*2
2个72 GPU模型比较:选择NVL 72的原因以及删除NVL 36的原因*2
开发资源有限。最初的计划是同时开发3个GB200项目(NVL36、NVL72、NVL36*2)。从11月中旬开始的开发放弃(DevDrop)将集中在NVL72和NVL36*2(NVL36在理论上准备进入量产阶段)上,两个版本的最终质量保证(QA)计划于2025年3月中旬完成。然而,由于NVL36的开发存在不确定性,同时开发两个72GPU版本(NVL72和NVL36*2)将更加困难。
NVL72将节省数据中心空间。如果能够妥善解决侧板冷却设计的问题,NVL72将比NVL36*2少一个机架,从而提高数据中心的空间效率。
NVL72的推理效率更高。NVL72和NVL36*2受益于可并行化的软件设计,在AI LLM的训练结果几乎没有区别。但在无法并行化或难以并行化的推理过程(如自回归模型)中,NVL72倾向于比NVL36*2更出色。
客户的主要偏好是如微软等客户更倾向于NVL72而不是NVL36*2。
NVL72将节省数据中心空间。如果能够妥善解决侧板冷却设计的问题,NVL72将比NVL36*2少一个机架,从而提高数据中心的空间效率。
NVL72的推理效率更高。NVL72和NVL36*2受益于可并行化的软件设计,在AI LLM的训练结果几乎没有区别。但在无法并行化或难以并行化的推理过程(如自回归模型)中,NVL72倾向于比NVL36*2更出色。
客户的主要偏好是如微软等客户更倾向于NVL72而不是NVL36*2。
NVIDIA一直在倡导单机柜NVL72的执行公共承诺。为了履行这些承诺在资源受限的情况下,优先开发NVL72而不是NVL36*2。
NVL72的开发面临前所未有的技术挑战,生产时间表仍然未知。
NVL72的开发面临前所未有的技术挑战,生产时间表仍然未知。
NVL72开发的最大挑战主要源于132 kW热设计功耗(TDP)要求,这使得NVL72成为历史上最耗电的服务器。Nvidia及其供应链需要更多时间来解决前所未有的技术问题。
需要注意TDP指的是在连续运行时的平均功耗。如果设计不足以致峰值功耗(Nvidia称之为电能设计点(EDP))超过TDP,则可能需要两台以上的旁路机。这将导致散热设计复杂化,制造过程变得困难,并且NVL72数据中心的省空间优势也会丧失。
另一个旁路机设计上的挑战是要稳定控制接近的温度在5-10°C内,但放宽此标准可能会影响系统的稳定性。
前述高耗电量问题不仅涉及旁路机,而且与所有组件和系统设计有关值得注意。
根据我的最新供应链调研报告,NVL72的量产可能会延迟至25年下半年(与Nvidia的乐观目标相反,Nvidia的目标是25年上半年)。
需要注意TDP指的是在连续运行时的平均功耗。如果设计不足以致峰值功耗(Nvidia称之为电能设计点(EDP))超过TDP,则可能需要两台以上的旁路机。这将导致散热设计复杂化,制造过程变得困难,并且NVL72数据中心的省空间优势也会丧失。
另一个旁路机设计上的挑战是要稳定控制接近的温度在5-10°C内,但放宽此标准可能会影响系统的稳定性。
前述高耗电量问题不仅涉及旁路机,而且与所有组件和系统设计有关值得注意。
根据我的最新供应链调研报告,NVL72的量产可能会延迟至25年下半年(与Nvidia的乐观目标相反,Nvidia的目标是25年上半年)。
免责声明:社区由Moomoo Technologies Inc.提供,仅用于教育目的。
更多信息
评论
登录发表评论
失金狼売キング : 果然,Blackwell是革衣高价股票出售用的
Vapor硬件吗?
连年推出的新款也是事实上的股价对策的谎言,
这种情况甚至可以说是变得不奇怪了。