英伟达的即将推出的人工智能芯片将因设计缺陷延迟三个月或更长时间,这一疏忽可能影响到Meta Platforms、Google和Microsoft等客户,它们共同订购了价值数百亿美元的芯片和服务器硬件。
$英伟达 (NVDA.US)$ Nvidia本周告诉微软这个大客户以及另一家大型云服务提供商,关于其新款Blackwell系列中最先进的AI芯片的延迟,微软的一位员工和另一位内部知情人士透露。
Nvidia告诉微软和另一家大型云服务提供商,关于其新款Blackwell系列中最先进的AI芯片的延迟,微软的一位员工和另一位内部知情人士透露。
$微软 (MSFT.US)$ Nvidia告诉微软和另一家大型云服务提供商,关于其新款Blackwell系列中最先进的AI芯片的延迟,微软的一位员工和另一位内部知情人士透露。
Nvidia告诉微软和另一家大型云服务提供商,关于其新款Blackwell系列中最先进的AI芯片的延迟,微软的一位员工和另一位内部知情人士透露。
延迟是由设计缺陷引起的,这导致芯片的产量减少。
这一问题可能会影响Microsoft、OpenAI和其他公司的人工智能发展计划。
Nvidia于3月份发布了Blackwell芯片,并且CEO黄仁勋在5月份表示,公司计划在今年晚些时候运送大量Blackwell芯片。然而,在生产过程中不寻常地晚出现了设计问题。据参与Blackwell芯片的相关人士称,Nvidia正在与其芯片制造商台积电进行新的测试生产,以解决这些问题。
因此,预计要到第一季度才会有大批货物发货。根据一位在这类数据中心工作的人士称,收到芯片后,云服务提供商通常需要大约三个月时间才能使它们的大型集群投入运行。
设计和生产问题加剧了美国司法部正在调查的有关英伟达的担忧,有关者抱怨其涉嫌反竞争行为。尽管如此,该公司仍处于强劲地位,其芯片性能远超竞争对手。
股东对Blackwell芯片的期望很高。Keybanc资本市场的分析师预测,到2025年,Blackwell芯片可能将英伟达的数据中心收入从2024年的475亿美元增至2000亿美元以上。(这样的估计可能未考虑到新的延误情况。)
“今年我们将看到大量的Blackwell芯片收入,”黄说在与分析师的五月业绩会上。
英伟达的AI服务器芯片,也就是图形处理单元,一直是开发者如OpenAI等的会话和视频人工智能的生命线。它们还帮助微软等云服务提供商通过将芯片出租给其他开发者来推动销售额。
如果即将推出的AI芯片,也就是B100、B200和GB200,延迟三个月或更长时间,可能会阻止一些客户在2025年第一季度按照计划在其数据中心中投入大型芯片集群的运行。
这些公司表示,他们需要多次的计算能力才能实现软件性能的大幅提升,以便能够更好地回答复杂的查询、自动化多步骤任务或生成逼真的视频。他们期望英伟达的下一代人工智能芯片可以实现这样的突破,尤其是当它们在一个集群中组合在一起,也被称为超级计算机。
英伟达发言人对于其向客户关于延迟的声明不予置评,但表示客户正在测试Blackwell芯片的样品,"产品今年晚些时候将加速推出"。
微软、谷歌和亚马逊网络服务以及Meta的发言人都拒绝置评。台积电的发言人在下班后没有回复评论请求。
$谷歌-C (GOOG.US)$ 微软、谷歌和亚马逊网络服务以及Meta的发言人都拒绝置评。台积电的发言人在下班后没有回复评论请求。
$亚马逊 (AMZN.US)$ 微软、谷歌和亚马逊网络服务以及Meta的发言人都拒绝置评。台积电的发言人在下班后没有回复评论请求。
$台积电 (TSM.US)$ 微软、谷歌和亚马逊网络服务以及Meta的发言人都拒绝置评。台积电的发言人在下班后没有回复评论请求。
英伟达的最大客户特别看好GB200芯片。过去一周,谷歌、Meta和微软披露了在数据中心和人工智能芯片上的前所未有的增长,暂时推高了英伟达的股价,并引发了关于这些公司何时能从这些投资中产生收入和利润的问题。
庞大的Blackwell订单
比如,谷歌已经下单购买了超过400,000个GB200芯片,两名从事芯片工作的人员透露。加上服务器硬件的成本,谷歌的订单金额可能超过100亿美元,尽管谷歌期望何时收到这些芯片尚不清楚。
在大规模生产之前发现重大设计缺陷是非常不寻常的。
要将这笔金额放在一个背景中,谷歌今年在芯片和其他设备以及物业上的支出预计达到500亿美元,较去年增长超过50%。
欧坦也下了至少100亿美元的订单,而微软在最近几周将其订单规模增加了20%,但无法得知其总订单规模。据一位知情人士透露,微软计划在2025年第一季度为OpenAI准备55,000至65,000个GB200芯片。
根据一位了解情况的人士透露,微软经理原计划在1月份向OpenAI提供Blackwell芯片驱动的服务器,但可能需要计划到3月或早春。
在准备大规模生产过程中,台积电的工程师最近几周发现了Blackwell芯片的缺陷问题。
GB200芯片由两个相连的Blackwell GPU芯片和一个Grace中央处理单元组成。问题出在将这两个Blackwell GPU芯片连接在一起的处理器芯片上。这个问题降低了台积电能够为英伟达生产的芯片数量。这类问题通常会促使公司停止生产。
因此,英伟达一直在对设计进行调整,并将在台积电进行新的生产测试,以便开始大规模生产,两位知情人透露。
英伟达告诉至少一家云供应商,它可能会考虑生产一个仅包含一个黑韦尔芯片的版本,以避免芯片问题并更快地发货,据一位与英伟达关于延迟问题交谈过的人士称。
不寻常的延迟
台积电最初计划在第三季度开始大规模生产Blackwell芯片,并在第四季度开始批量发运给英伟达的客户。预计Blackwell芯片现在将在第四季度开始大规模生产,如果没有进一步问题,服务器计划在随后的季度批量发运,他们说。
芯片延迟并不罕见。据一位具有直接知识的人士称,英伟达在2020年旗舰GPU的早期版本中遇到了一些延迟。但那时英伟达的风险较低,客户依赖订单来开始从其数据中心和芯片投资中产生收入的也较少。
然而,在大规模生产之前发现重大设计缺陷是极不寻常的。芯片设计师通常与台积电等芯片制造商合作进行多次生产测试运行和模拟,以确保产品的可行性和制造过程的顺利进行,然后才接受客户的大量订单。
对于全球最大芯片制造商台积电而言,停止生产线并拿出高调产品回炉重造,尤其是在接近大规模生产阶段,也是不太常见的,根据两位台积电员工的说法。台积电已经为GB200的大规模生产空出了机器容量,但必须让其机器处于闲置状态,直到问题解决为止。
设计缺陷还将影响英伟达的NVLink服务器机架的生产和交付,因为负责服务器的公司必须等待新的芯片样品才能最终确定服务器机架设计。
105535782 : 好吧
Space Dust : 谢谢 。Long Term 先生...
哇。。
这可能是把毛衣拆开的 拉头。
在这个阶段出现这样的设计缺陷非常不寻常?
哎哟,我的意思是英伟达,安然会跌到多低。
Space Dust : 公司几乎总部设在台湾。而且,敌人再也无法比让一家庞大资本万亿的公司退出市场更直接地伤害美国了。
责任。台积电倒闭了吗?
美国是否都通过英伟达为新工厂融资,时机已成熟,没收了敌人式的资产,
同时,让一家大公司突然颠覆市场,制造大规模动荡,然后,当 的时机成熟时 。
把所有东西都炸掉...
有太多的诡计在起作用,无法完全相信任何 mSM 消息来源...
104166257 : 嗨
Ramamohan : 一切都很好
54088 FROM RWS : 对
jalilah_104793183 : 学习
104309970 : 我又来了大家早上好