SemiAnalysisの創設者との深い対話：AIの新時代において、エヌビディアは挑戦されるのか。

wallstreetcn · 12/24 02:32

不考虑谷歌，全球AI工作量98%是在英伟达芯片上运行的；谷歌、亚马逊芯片目前各有各的问题，短期构不成挑战；数据短缺是伪命题，没有数据可以合成数据继续训练；明年的AI资本开支没问题，2026年存在不确定性，可能是行业转折点。

英伟达的市场份额到底有多大？公司的竞争优势到底在哪？AMD、谷歌、亚马逊的机会在哪？数据短缺是伪命题吗？行业资本开支真的没问题吗？转折点在哪？

近日，Semi Analysis创始人兼首席分析师迪伦·帕特尔（Dylan Patel）、硅谷著名科技投资人比尔.柯尔利（Bill Gurley）、布拉德·格斯特纳 (Brad Gerstner)展开三方对谈，就AI芯片目前的现状，英伟达的竞争优势还能持续多久，数据短缺是否是伪明天，以及AI资本开支还能持续多久进行了深入的讨论。

以下是对谈核心要点：

不考虑谷歌，全球AI工作量中98%是在英伟达芯片上运行的，如果考虑谷歌这个数据是70%。
英伟达的优势是三方面：公司软件优于大部分半导体公司；硬件方面，他们能够率先采用新技术，并以极快的速度将芯片从设计推向部署；网络方面，他们收购MELLONOX，极大地提升了网络能力。
谷歌虽然在软件和计算元素方面有自己的理解，但在芯片封装设计和网络等困难领域需要与其他供应商合作。
随着数据中心的建设和电力供应的紧张，企业需要更加合理地规划资源。
文本是目前最有效的数据领域，但视频数据蕴含的信息更多。此外，预训练只是模型训练的一部分，推理时间计算也很重要。如果数据耗尽，可以通过创造合成数据来继续改进模型。
虽然预训练的一次性巨大收益可能已经过去，但通过增加计算资源，企业仍然可以获得一定的收益，尤其是在竞争激烈的环境下。收益仍然存在，只是获取难度增加了。
合成数据在能够进行功能验证的领域最有效。
华尔街目前对数据中心资本开支的估计通常过低。通过跟踪全球数据中心，微软、Meta、亚马逊等公司在数据中心容量上的支出非常大。这表明他们相信通过扩大规模可以在竞争中获胜，所以才会不断投入。
英伟达不是2000年的思科，双方估值没有可比性。
预训练可能会遇到收益递减或成本过高的问题，但合成数据生成和推理时间计算成为新的发展方向。
目前公司对于推理的投入相对较小。预计在未来6个月到 1 年，在某些具有功能验证的基准测试中，模型性能将有巨大提升。
目前 GPT - 4o非常昂贵，但如果降低模型规模，成本会大幅下降。
AMD 在芯片工程方面表现出色，但在软件方面存在明显不足。他们缺乏足够的软件开发人员，也没有投入资金建设 GPU 集群来开发软件，这与英伟达形成鲜明对比。
谷歌与博通合作构建的TPU系统，在芯片互连、网络架构等方面具有竞争力，甚至在某些方面优于英伟达。
谷歌的TPU在商业上的成功相对有限，主要原因包括其软件不够开放，定价没有竞争力，主要用于内部服务等。
亚马逊芯片通过降低成本，在 HBM 内存带宽和每美元成本方面具有优势，虽然在技术指标上（如内存、带宽等）低于英伟达，但对于一些对成本敏感的应用场景具有吸引力。
从市场整体来看，超大规模数据中心计划在明年大幅增加支出，这将带动整个半导体生态系统（包括网络设备供应商、ASIC 供应商、系统供应商等）的发展。
2026 年的情况存在一定的不确定性。一方面，模型性能是否能够持续提升将是关键因素。如果模型性能提升速度放缓，可能会导致市场出现调整。

以下为对谈全文，由AI进行翻译

主持人：迪伦，欢迎来到我们的节目。今天我们要深入探讨一个今年一直在讨论的话题，那就是计算机世界正在发生的根本性变化。比尔，你先来给大家介绍一下迪伦吧。

比尔：好的，我们很高兴邀请到 SemiAnalysis 的迪伦・帕特尔。迪伦迅速建立起了全球半导体行业最受尊敬的研究团队之一。今天我们想深入探讨迪伦在技术层面所了解的架构、芯片缩放趋势、全球市场的主要参与者、供应链等知识，并将其与我们听众关心的商业问题联系起来。我希望能对与人工智能热潮相关的半导体活动进行一个阶段性的总结，并尝试从整体上把握其发展趋势。

迪伦：很高兴来到这里。我小时候，我的 Xbox 坏了，我父母是移民，我在佐治亚州的农村长大，没什么事可做，就只能捣鼓电子产品。我打开 Xbox，短路了温度传感器，然后修好了它。从那时起，我就对半导体产生了浓厚的兴趣，开始阅读半导体公司的财报并投资，还深入研究技术相关的内容。

主持人：能给我们简单介绍一下 SemiAnalysis 吗？

迪伦：我们是一家半导体和人工智能研究公司，为超大规模数据中心、大型半导体私募股权公司和对冲基金等提供服务。

我们销售全球数据中心的相关数据，包括每个季度的功率、建设进展等；跟踪全球约 1500 家晶圆厂（但实际关键的约 50 家）；还提供供应链相关数据，如电缆、服务器、电路板、变压器等设备的数据，并进行预测和咨询服务。

不考虑谷歌，全球98%的AI工作都使用英伟达芯片

比尔：迪伦，我们都知道英伟达在 AI 芯片领域占据主导地位，你认为目前全球 AI 工作量中有多少是在英伟达芯片上运行的呢？

迪伦：如果不考虑谷歌，占比超过 98%。但如果把谷歌算进去，大约是 70%。因为谷歌有很大一部分 AI 工作量，尤其是生产性工作量，是在自己的芯片上运行的。

比尔：你说的生产性工作量是指那些能产生收益的业务，比如谷歌搜索和谷歌的其他大型 AI 驱动业务吗？

迪伦：没错。谷歌的非大语言模型（LLM）和其他生产性工作负载运行在其内部自研芯片上。

实际上，谷歌早在 2018 - 2019 年就在搜索工作负载中使用了 Transformer 技术，比如 BERT 就是当时非常知名且流行的 Transformer 模型之一，多年来一直在其生产搜索工作负载中运行。

三项优势结合让英伟达目前主导市场

比尔：那回到英伟达，为什么它如此主导市场呢？

迪伦：可以把英伟达比作三头龙。全球大多数半导体公司在软件方面表现不佳，但英伟达除外。

在硬件方面，英伟达也比大多数公司更出色，他们能够率先采用新技术，并以极快的速度将芯片从设计推向部署。此外，在网络方面，他们收购了 MELLONOX，极大地提升了网络能力。这三个方面的优势相结合，使得其他半导体公司难以单独与之竞争。

比尔：你之前写过一篇文章，帮助大家理解了英伟达这些现代尖端部署的复杂性，包括机架、内存、网络和规模等方面，能再给我们简单介绍一下吗？

迪伦：好的。当我们看 GPU 时，运行一个 AI 工作负载通常需要多个芯片协同工作，因为模型的规模已经远超单个芯片的能力。

英伟达的 NVLink 架构能够很好地将多个芯片联网，但有趣的是，谷歌和博通早在英伟达之前就合作构建了类似的系统架构，比如谷歌在 2018 年就用 TPU 构建了类似系统。

谷歌虽然在软件和计算元素方面有自己的理解，但在芯片封装设计和网络等困难领域需要与其他供应商合作。

现在，英伟达推出了 Blackwell 系统，这是一个包含多个 GPU 的机架，重达三吨，有数千根电缆，非常复杂。

而竞争对手如 AMD 等，最近也通过收购来进入系统设计领域，因为构建一个能够协同工作、冷却良好、网络可靠的多芯片系统是一个极具挑战性的问题，半导体公司通常缺乏相关工程师。

比尔：那你认为英伟达在哪些方面进行了增量差异化投资呢？

迪伦：英伟达主要在供应链方面进行了大量投资。他们必须与供应链紧密合作，以开发下一代技术并率先推向市场。

例如，在网络、光学、水冷和电力传输等领域，英伟达不断推出新技术，以保持其竞争优势。他们的节奏非常快，每年都有很多变化，像 Blackwell、Rubin 等产品的推出。如果他们停滞不前，就会面临竞争压力，因为其他竞争对手也在努力追赶。

比尔：如果英伟达停滞不前，他们在哪些方面可能会面临竞争？市场上其他替代品需要具备哪些条件才能占据更多的工作负载份额呢？

迪伦：对于英伟达来说，其主要客户在 AI 方面的支出巨大，他们有足够的资源来研究如何在其他硬件上运行模型，尤其是在推理方面。

虽然英伟达在推理软件方面的优势相对较小，但他们的硬件性能目前是最好的，这意味着更低的资本成本、运营成本和更高的性能。如果英伟达停止进步，其性能优势将不再增长，其他竞争对手就有机会。

例如，现在随着 Blackwell 的推出，英伟达不仅在推理性能上比以前的产品快 10 - 15 倍（针对大型模型进行了优化），还降低了利润率以应对竞争，他们计划每年将性能提升 5 倍以上，这是一个非常快的速度。同时，AI 模型本身也在不断改进，成本也在下降，这将进一步刺激需求。

比尔：你提到软件在训练和推理中的作用不同，能详细解释一下吗？

迪伦：很多人把英伟达的软件简单地称为 Kuta，但实际上它包含很多层次。

在训练方面，用户通常依赖英伟达的软件性能，因为研究人员不断尝试新的方法，没有太多时间去优化性能。

而在推理方面，像微软这样的公司，会在有限的几个模型上进行部署，并且每六个月左右更新一次模型，他们可以投入大量工程师来优化这些模型在其他硬件上的运行性能。例如，微软已经在 AMD 等公司的硬件上部署了 GPT 风格的模型。

主持人：我们之前提到过一张图表，显示未来四年将有一万亿美元的新 AI 工作量，以及一万亿美元的数据中心替换工作量，你对此怎么看？有人认为人们不会用英伟达的 GPU 来重建 CPU 数据中心，你怎么回应这种观点？

迪伦：英伟达长期以来一直在推动非 AI 工作负载使用加速器，比如专业可视化领域（如 Pixar 制作电影）、西门子工程应用等都使用了 GPU。

虽然这些在 AI 领域相比只是一小部分，但确实存在应用。关于数据中心替换，虽然 AI 发展迅速，但传统工作负载（如网络服务、数据库）并不会因此停止或放缓。数据中心的供应链较长，建设周期也长，这是一个现实问题。

例如，英特尔的 CPU 在过去几年进展缓慢，而 AMD 的出现提供了更高性能的选择，许多亚马逊数据中心的旧英特尔 CPU 服务器已经使用多年，现在可以用性能更高的新服务器（如 128 核或 192 核）来替换，这样不仅能提升性能，还能在相同功耗下减少服务器数量，从而为 AI 服务器腾出空间。

所以，虽然有数据中心替换的情况，但市场整体仍在增长，只是 AI 的发展促使了这种行为，因为企业需要更多的计算能力来支持 AI 应用。

主持人：这让我想起上周萨沙在节目中提到的，他说他们受到数据中心和电力的限制，而不是芯片的限制，你觉得这与你刚刚的解释有什么关联吗？

迪伦：我认为萨沙的观点强调了数据中心和电力在当前的瓶颈地位，这与芯片供应情况不同。随着数据中心的建设和电力供应的紧张，企业需要更加合理地规划资源，这也解释了为什么他们会采取一些措施，如从加密货币挖矿公司获取电力资源，或者延长旧服务器的折旧周期等。

如果没有数据，可以创造合成数据改进模型

主持人：在讨论替代英伟达的方案之前，我们先谈谈你在文章中提到的预训练和缩放辩论吧。伊利亚特说数据是 AI 的 “化石燃料”，我们已经消耗了大部分，预训练的巨大收益不会再重复，你怎么看这个观点？

迪伦：预训练缩放定律相对简单，增加计算资源可以提升模型性能，但这涉及到数据和参数两个维度。

当数据耗尽时，虽然可以继续扩大模型规模，但收益可能会减少。不过，目前我们对视频数据的利用还非常有限，这是一个误解。实际上，文本是目前最有效的数据领域，但视频数据蕴含的信息更多。此外，预训练只是模型训练的一部分，推理时间计算也很重要。如果数据耗尽，我们可以通过创造合成数据来继续改进模型，例如 OpenAI 等公司正在尝试的方法，通过让模型生成大量数据，然后进行功能验证，筛选出有效的数据用于训练，从而提高模型的性能。虽然这种方法目前还处于早期阶段，投入的资金相对较少，但它为模型改进提供了新的方向。

主持人：从投资的角度来看，英伟达备受关注。但如果预训练的收益已经大部分被获取，为什么大家还在建造更大的集群呢？

迪伦：虽然预训练的一次性巨大收益可能已经过去，但通过增加计算资源，我们仍然可以获得一定的收益，尤其是在竞争激烈的环境下，企业希望通过提升模型性能来保持竞争力。

此外，模型与竞争对手模型之间的对比也促使企业不断投入。虽然从投资回报率来看，继续扩大规模可能是对数级别的昂贵，但仍然可能是一个理性的决策，因为收益仍然存在，只是获取难度增加了。而且，随着合成数据生成等新方法的出现，模型改进的速度可能会加快，这也为企业继续投资提供了动力。

主持人：那在哪些领域合成数据最有效呢？能举例说明吗？

迪伦：合成数据在能够进行功能验证的领域最有效，比如在谷歌的服务中，他们有大量的单元测试来确保系统正常运行，这些单元测试可以用来评估 LLM 生成的输出是否正确。

在数学、工程等领域，输出可以通过明确的标准进行评估，而在一些主观领域，如艺术、写作风格、谈判技巧等，很难进行功能验证，因为这些领域的评判标准比较主观。例如，在图像生成领域，很难说哪张图像更美，因为这取决于个人喜好；而在数学计算或工程设计中，可以明确判断输出是否正确。

华尔街低估了大型数据中心的资本支出

主持人：你从超大规模数据中心那里听到了什么？他们都说明年资本支出（capex）会增加，正在建造更大的集群，这是真的吗？

迪伦：根据我们的跟踪和分析，华尔街对 capex 的估计通常过低。我们跟踪全球每个数据中心，发现微软、Meta、亚马逊等公司在数据中心容量上的支出非常大。

他们签署了明年的数据中心租赁协议，预计云收入将加速增长，因为他们目前受到数据中心容量的限制。这表明他们相信通过扩大规模可以在竞争中获胜，所以才会不断投入。

主持人：你之前提到的关于预训练的大规模集群建设，如果预训练趋势发生变化，他们在推理方面的建设会有什么变化吗？

迪伦：在训练神经网络时，正向传播用于生成数据，反向传播用于更新权重，而在合成数据生成、评估输出和训练模型的新范式中，正向传播的计算量大幅增加，因为需要生成大量可能性，而反向传播的计算量相对较少，因为只在少数有效数据上进行训练。这意味着在训练过程中有大量的推理计算，实际上训练中的推理计算量比更新模型权重的计算量还要大。

此外，在训练模型时，是否需要所有组件都在同一位置取决于具体情况。

例如，微软在不同地区建设多个数据中心，因为他们发现可以将推理工作负载分配到不同数据中心，同时在其他地方更新模型，这样可以更有效地利用资源。因此，预训练的范式并没有放缓，只是每一代的改进成本呈对数增加，但企业正在寻找其他方法来降低成本，提高效率。

英伟达不是2000年的思科

主持人：有人将英伟达与思科在 2000 年的情况进行比较，你怎么看？

迪伦：这种比较存在一些不公平之处。思科的收入很大一部分来自私人 / 信贷投资于电信基础设施建设，而英伟达的收入来源与此不同，其私人 / 信贷投资占比较小，如 CoreWeave 由微软支持。

此外，在互联网泡沫时期，进入该领域的私人资本规模远大于现在，虽然现在风险投资市场看似活跃，但实际上私人市场（如中东主权财富基金）的资金尚未大量进入。而且，与思科当时相比，现在这些盈利公司的资本来源、正现金流以及投资的理性程度都有所不同。英伟达目前的市盈率为 30，与思科当时的 120 相比还有很大差距，因此不能简单地进行类比。

推理时间推理（inference time reasoning）是扩展智能的新方向

主持人：你提到推理时间推理是扩展智能的新方向，并且计算密集度比预训练更高，能详细解释一下吗？

迪伦：预训练可能会遇到收益递减或成本过高的问题，但合成数据生成和推理时间计算成为新的发展方向。

推理时间计算听起来不错，因为不需要在训练模型上花费更多成本，但实际上存在很大的权衡。以 GPT - 4o 为例，它在推理时会生成大量数据，但最终输出给用户的只是其中一部分，在这个过程中，模型需要消耗大量计算资源。

例如，在处理用户请求时，模型可能会生成数千个中间结果（令牌），但最终只输出几百个给用户。这意味着计算成本大幅增加，不仅因为生成的令牌数量增加，还因为在处理这些令牌时，需要更多的内存来存储上下文信息（如 KV 缓存），这导致服务器能够同时处理的用户请求数量减少，从而增加了每个用户的成本。

从成本角度看，对于微软这样的公司，如果其推理收入为 100 亿美元，毛利率为 50 - 70%，成本为几十亿美元，当使用像 GPT - 4o 这样的模型时，由于推理计算成本增加，其成本可能会显著上升，尽管模型性能更好，可以收取更高费用，但成本的增加幅度可能超过收入的增加幅度。

GPT - 4o模型的企业级需求被低估了

主持人：那市场对 GPT - 4o 这样的模型的企业级需求是被高估还是低估了呢？

迪伦：GPT - 4o 目前还处于早期阶段，人们对它的理解和应用还不够深入。

但从目前一些匿名基准测试来看，有很多公司（如谷歌、Anthropic 等）正在开发推理模型，并且他们看到了通过增加计算资源来提升模型性能的明确路径。这些公司在推理方面的投入相对较少，目前还处于起步阶段，但他们有很大的提升空间，预计在未来 6 个月到 1 年，在某些具有功能验证的基准测试中，模型性能将有巨大提升。因此，市场对这类模型的需求潜力巨大，但目前还难以准确评估。

主持人：回顾互联网浪潮，当时很多创业公司最初依赖甲骨文和太阳公司的技术，但五年后情况发生了变化。在 AI 芯片领域，这种情况会发生吗？

迪伦：目前 GPT - 4o 非常昂贵，但如果降低模型规模，成本会大幅下降。

例如，从 GPT - 4o 到 Llama 7b，成本可以降低很多。对于小型模型，推理相对容易，可以在单个芯片上运行，这导致市场竞争激烈，许多公司提供基于 Llama 等模型的 API 推理服务，价格竞争激烈，利润率较低。

相比之下，像微软这样使用 OpenAI 模型的公司，毛利率较高（50 - 70%），因为他们拥有高性能模型，并且有企业或消费者愿意为其支付高额费用。

但随着更多公司进入市场，模型的差异化变得更加重要，只有拥有最好的模型，并且能够找到愿意为其付费的企业或消费者，才能在竞争中脱颖而出。因此，市场正在快速筛选，最终可能只有少数几家公司能够在这个领域竞争。

谷歌、亚马逊芯片各自有优劣

主持人：那在这些竞争公司中，AMD 的情况如何呢？

迪伦：AMD 在芯片工程方面表现出色，但在软件方面存在明显不足。他们缺乏足够的软件开发人员，也没有投入资金建设 GPU 集群来开发软件，这与英伟达形成鲜明对比。

此外，AMD 一直专注于与英特尔竞争，缺乏系统级设计经验，虽然收购了 ZT 系统公司，但在大规模数据中心的系统架构设计方面仍落后于英伟达。

超大规模数据中心客户（如 Meta 和微软）在帮助 AMD 改进软件和理解模型开发、推理经济等方面，但 AMD 仍无法与英伟达在同一时间表上竞争。预计 AMD 明年在微软和 Meta 等客户中的 AI 收入份额将下降，但仍能从市场中获利，只是不会像英伟达那样取得巨大成功。

主持人：谷歌的 TPU 情况呢？它似乎是仅次于英伟达的选择。

迪伦：谷歌的 TPU 在系统和基础设施方面有其独特之处。单个 TPU 的性能虽然不错，但更重要的是其系统设计。谷歌与博通合作构建的 TPU 系统，在芯片互连、网络架构等方面具有竞争力，甚至在某些方面优于英伟达。

此外，谷歌多年来采用水冷技术，提高了系统的可靠性，而英伟达直到最近才意识到需要水冷技术。

然而，谷歌的 TPU 在商业上的成功相对有限，主要原因包括其软件不够开放，很多内部使用的软件（如 DeepMind 使用的软件）未向谷歌云用户提供；

定价方面，虽然官方定价较高，但实际谈判后价格仍缺乏竞争力，相比其他云服务提供商（如甲骨文、微软、亚马逊等），谷歌的 TPU 价格没有优势；

此外，谷歌将大量 TPU 用于内部服务（如搜索、Gemini 应用等），外部租用市场份额较小，主要客户为苹果，且苹果租用 TPU 可能与对英伟达的态度有关（可能存在竞争关系，但具体原因暂未提及）。

主持人：那亚马逊呢？能像介绍谷歌 TPU 那样详细介绍一下亚马逊的芯片吗？

迪伦：亚马逊的芯片可以被称为 “亚马逊基础版 TPU”。它在一些方面具有成本效益优势，例如使用更多的硅和内存，网络能力与 TPU 有一定可比性，但在效率方面存在不足，如使用更多的有源电缆（与博通合作的谷歌 TPU 使用无源电缆），硅片面积使用效率较低等。

然而，亚马逊通过降低成本，在 HBM 内存带宽和每美元成本方面具有优势，其芯片价格远低于英伟达，虽然在技术指标上（如内存、带宽等）低于英伟达，但对于一些对成本敏感的应用场景具有吸引力。

亚马逊与 Anthropic 合作建立了一个包含 40 万个芯片的超级计算机系统，他们相信大规模的芯片部署对于推理和模型改进是有用的，尽管在技术上可能不是最先进的，但成本效益使其成为亚马逊的一个合理选择。

明年资本开支明确，26年后存在不确定性

主持人：展望 2025 - 2026 年，你对半导体市场有什么看法？比如博通最近股价上涨，英伟达股价波动，你认为市场会如何发展？

迪伦：博通在定制 ASIC 领域取得了一些成果，例如赢得了多个定制 ASIC 订单，包括谷歌等公司的订单。谷歌正在努力提升其定制芯片的性能，尤其是在推荐系统方面。此外，像 OpenAI 等公司也在开发自己的芯片，苹果也有部分芯片与博通合作生产。这些发展趋势表明，市场竞争将更加激烈。

从市场整体来看，超大规模数据中心计划在明年大幅增加支出，这将带动整个半导体生态系统（包括网络设备供应商、ASIC 供应商、系统供应商等）的发展。

然而，2026 年的情况存在一定的不确定性。

一方面，模型性能是否能够持续提升将是关键因素。如果模型性能提升速度放缓，可能会导致市场出现调整，因为目前市场的增长在很大程度上依赖于模型性能的不断进步以及由此带来的对计算资源的需求增长。

另一方面，资本投入也是一个重要变量。目前中东主权财富基金、新加坡、北欧和加拿大养老基金等尚未大规模进入该市场，但如果他们未来决定投入大量资金，将对市场产生重大影响。

此外，新云市场将面临整合。目前我们跟踪的约 80 家新云服务提供商中，只有少数（5 - 10 家）可能在竞争中存活下来。其中 5 家是主权云服务提供商，另外 5 家左右是具有市场竞争力的企业。

当前，GPU 租赁市场价格变化迅速，例如英伟达 H100 的租赁价格大幅下降，不仅新云服务提供商之间的竞争激烈，亚马逊等大型云服务提供商的按需 GPU 定价也在快速下降。企业购买 GPU 集群的比例仍然相对较低，他们更倾向于将 GPU 计算需求外包给新云服务提供商，但随着市场整合，这种情况可能会发生变化。

对于英伟达来说，虽然其面临竞争，但如果能够继续保持技术领先，推出性能更优、成本更低的产品，仍然有机会在市场中占据主导地位。例如，他们即将推出的产品成本虽然高于前代产品，但通过优化性能和调整价格策略，仍有可能实现增长。然而，如果市场需求未能如预期增长，或者出现更具竞争力的替代品，英伟达的收入可能会受到影响。

主持人：非常感谢迪伦今天的分享，这让我们对半导体行业在 AI 领域的发展有了更深入的了解。希望在未来我们能继续关注这个领域的动态，也期待看到各公司在这个充满机遇和挑战的市场中的表现。再次感谢！

迪伦：谢谢，很高兴能在这里分享我的观点。

主持人：提醒一下大家，以上内容仅代表我们的观点，不构成投资建议。

グーグルを考慮しない場合、グローバルなAIの作業量の98%はエヌビディアのチップ上で実行中です。グーグルやアマゾンドットコムのチップはそれぞれ問題を抱えており、短期的には挑戦を形成することはありません。データ不足は偽の命題であり、データがなければデータを合成して訓練を続けることができます。来年のAIの資本支出には問題はありませんが、2026年は不確実性があり、業種の転換点になる可能性があります。

エヌビディアのマーケットシェアは実際にどれくらいの大きさなのか。会社の競争優位性はどこにあるのか。AMD、グーグル、アマゾンドットコムの機会はどこにあるのか。データ不足は虚偽の命題なのか。業種の資本支出には本当に問題がないのか。転換点はどこにあるのか。

最近、Semi Analysisの創設者兼チーフアナリストであるディラン・パテル、シリコンバレーの著名なテクノロジー投資家ビル・カーリー、ブラッド・ガーストナーが三者対談を行い、AIチップの現状、エヌビディアの競争優位性がどれくらい持続できるか、データ不足が虚偽の命題なのか、AI資本支出はどれくらい持続するのかについて深く議論した。

以下は対談の核心要点です：

グーグルを考慮しない場合、グローバルAI作業の98%はエヌビディアのチップで実行されており、グーグルを考慮するとこのデータは70%になる。
エヌビディアの利点は三つの側面がある。会社のソフトウェアは多くの半導体会社より優れており；ハードウェア面では、彼らは新技術を率先して採用し、非常に迅速に設計からデプロイにチップを推進できる；ネットワーク面では、彼らはMELLONOXを買収し、ネットワーク能力を大幅に向上させた。
グーグルはソフトウェアと計算要素に関して理解があるが、チップパッケージ設計やネットワークなどの困難な分野では他のサプライヤーと協力する必要がある。
データセンターの建設と電力供給の緊張が進む中、企業はより合理的にリソースを計画する必要がある。
テキストは現在最も効果的なデータ領域ですが、ビデオデータにはより多くの情報が含まれています。また、事前トレーニングはモデル訓練の一部に過ぎず、推論時間の計算も重要です。データが枯渇した場合、合成データを生成することでモデルの改善を続けることができます。
事前トレーニングの一度の巨大な利益は過去のものかもしれませんが、計算リソースを増やすことで企業は依然として何らかの利益を得られます。特に競争の激しい環境では、利益は依然として存在しますが、取得の難易度が増しています。
合成データは機能検証が可能な領域で最も効果的です。
ウォール街は現在、データセンターの設備投資の見積もりを過小評価している傾向があります。グローバルデータセンターをトレールすることで、マイクロソフト、Meta、アマゾンドットコムなどの企業がデータセンターの容量に対して非常に多くの支出を行っていることが分かります。これは、スケールを拡大することで競争に勝つことができると信じていることを示しているため、彼らは継続的に投資をしています。
エヌビディアは2000年のシスコシステムズではなく、両者の評価額には比較することができません。
事前トレーニングは利益が減少したり、コストが高すぎるという問題に直面する可能性がありますが、合成データ生成と推論時間の計算が新しい発展の方向性となります。
現在、企業は推論に対する投資が相対的に少ないです。今後6ヶ月から1年の間に、特定の機能検証が可能なベンチマークでモデルのパフォーマンスが大幅に向上する見込みです。
現在、GPT-4oは非常に高価ですが、モデルの規模を縮小すればコストが大幅に減少します。
AMDはチップエンジニアリングにおいて優れたパフォーマンスを示していますが、ソフトウェアの面では明らかな不足があります。彼らは十分なソフトウェア開発者が不足しており、ソフトウェアを開発するためのGPUクラスター構築に資金を投入していません。これはエヌビディアとは対照的です。
グーグルがブロードコムと連携して構築したTPUシステムは、チップの相互接続やネットワークアーキテクチャにおいて競争力があり、特定の面ではエヌビディアを上回っています。
グーグルのTPUの商業的成功は相対的に限られており、その主な理由はソフトウェアが十分にオープンでなく、価格競争力がなく、主に内部サービスに使用されているためです。
アマゾンのチップはコストを削減することで、HBMメモリの帯域幅や1ドルあたりのコストで優位性を持っていますが、技術的指標（メモリや帯域幅など）ではエヌビディアに劣っています。しかし、コストに敏感なアプリケーションには魅力的です。
市場全体から見ると、超大規模データセンターは来年大幅に支出を増やす予定で、これにより半導体エコシステム（ネットワーク機器供給業者、ASIC供給業者、システム供給業者など）の発展を促します。
2026年の状況には一定の不確実性があります。一方で、モデルのパフォーマンスが持続的に向上するかどうかが重要な要素となります。もしモデルのパフォーマンスの向上が鈍化した場合、市場に調整が生じる可能性があります。

以下は対談全文で、AIによる翻訳です。

司会者：ディレン、私たちの番組にようこそ。今日は、今年ずっと話題になっているテーマ、つまりコンピュータの世界で起こっている根本的な変化について深く探ります。ビル、まずはディレンを紹介してください。

比ル：良いですね。私たちはSemiAnalysisのディラン・パテルを招待できてとても嬉しいです。ディランは、グローバル半導体業界で最も尊敬される研究チームの一つを迅速に立ち上げました。今日は、ディランが技術的な観点から理解しているアーキテクチャ、チップのスケーリングトレンド、グローバル市場の主要な参加者、サプライチェーンなどの知識について深く探り、それをリスナーが関心を持つビジネス問題に結びつけたいと思います。人工知能熱潮に関連した半導体活動を段階的にまとめ、その発展トレンドを全体的に把握できることを期待しています。

ディラン：ここに来られて嬉しいです。子供の頃、私のXboxが壊れました。両親は移民で、ジョージア州の農村で育ち、何もすることがなく、ただ電子機器をいじっていました。私はXboxを開けて、温度センサーを短絡させ、修理しました。その時から、半導体に強い興味を持ち始め、半導体会社の決算発表を読み始め、投資を行い、技術に関連する内容を深く研究しました。

ホスト：SemiAnalysisについて簡単に紹介してもらえますか？

ディラン：私たちは半導体と人工知能の研究会社で、超大規模データセンター、大型半導体プライベートエクイティ企業、ヘッジファンドなどにサービスを提供しています。

私たちは、グローバルデータセンターの関連データを販売しており、各四半期の電力、建設進捗などを含んでいます。また、約1500のウェハファウンドリを追跡（ただし実際には約50の重要なもの）しており、ケーブル、サーバー、基板、変圧器などのデバイスに関するサプライチェーン関連データを提供し、予測とコンサルティングサービスも行っています。

Googleを考慮しない場合、グローバルの98%のAI業務はエヌビディアのチップを使用しています。

比ル：ディラン、私たちは皆、エヌビディアがAIチップの領域で支配的な地位を占めていることを知っています。現在、グローバルAI業務のどれくらいがエヌビディアのチップ上で実行されていると思いますか。

ディラン：Googleを除けば、98%以上です。しかし、Googleを考慮すると、大体70%です。Googleには多くのAI業務量があり、特に生産的な業務量の一部は、自社のチップ上で実行されています。

ビル：あなたが言う生産性の作業量は、Google検索やGoogleの他の大規模なAI駆動ビジネスのような、収益を生み出すビジネスを指していますか？

ディラン：その通りです。Googleの非大規模言語モデル（LLM）や他の生産性の作業負荷は、内部で自社開発したチップ上で実行中です。

実際、Googleは2018 - 2019年にはすでに検索作業負荷でTransformer技術を使用しており、BERTは当時非常に有名で人気のあるTransformerモデルの一つで、何年にもわたってその生産検索作業負荷で実行中です。

三つの利点が組み合わさり、エヌビディアは現在市場を主導しています。

ビル：では、エヌビディアに戻りますが、なぜそれほど市場を主導しているのでしょうか？

ディラン：エヌビディアを三つ頭のドラゴンに例えることができます。グローバルの大多数の半導体会社はソフトウェアの面で劣りますが、エヌビディアは例外です。

ハードウェアの面でも、エヌビディアは大多数の会社よりも優れています。彼らは新しいテクノロジーを率先して採用し、非常に速い速度でチップを設計から展開へと推進します。さらに、ネットワークの面ではMELLONOXを買収し、ネットワーク能力を大幅に向上させました。この三つの利点が組み合わさることで、他の半導体会社が彼らと単独で競争することが難しくなっています。

ビル：あなたは以前に、エヌビディアのこれらの現代の先端展開の複雑さを理解するのを助ける記事を書きました。機架、メモリ、ネットワーク、規模など、もう一度簡単に紹介してもらえますか？

ディロン：はい。GPUを見ると、AIワークロードを実行するには通常、複数のチップが協調して動作する必要があります。モデルの規模はすでに単一のチップの能力を超えています。

インテルのNVLinkアーキテクチャは複数のチップを良好にネットワーク化することができますが、興味深いことに、Googleとブロードコムはインテルよりも前に協力して同様のシステムアーキテクチャを構築しました。たとえば、Googleは2018年にTPUを使用して類似のシステムを構築しました。

Googleはソフトウェアと計算要素に関して独自の理解を持っていますが、チップのパッケージング設計やネットワークなどの困難な分野では他のサプライヤーと協力する必要があります。

現在、インテルはBlackwellシステムを発表しました。これは複数のGPUを含むラックで、重さは三トンで、数千本のケーブルがあり、非常に複雑です。

AMDなどの競争相手も最近、買収を通じてシステム設計分野に参入しています。複数のチップシステムが協調して動作し、冷却が良好で、ネットワークが信頼性があるものを構築することは非常に困難な課題であり、半導体会社は通常、関連するエンジニアを欠いています。

ビル：それでは、インテルがどの分野で増分差別化投資を行っていると考えますか？

ディロン：インテルは主にサプライチェーンの分野で多くの投資を行っています。彼らは次世代技術を開発し、市場に先駆けて投入するためにサプライチェーンと緊密に連携する必要があります。

たとえば、ネットワーク、光学、水冷、電力伝送などの分野で、インテルは競争上の優位性を維持するために新しい技術を次々と導入しています。彼らのペースは非常に速く、毎年多くの変化があります。BlackwellやRubinなどの製品が登場する場合、停滞すれば競争圧力に直面することになります。

ビル：もしエヌビディアが停滞した場合、どのような面で競争に直面する可能性がありますか？市場の他の代替品は、どのような条件を満たす必要がありますか、より多くの作業負荷のシェアを占めるために？

ディレン：エヌビディアにとって、AIに対する主要顧客の支出は途方もなく、モデルを他のハードウェアで動かす方法を研究するためのリソースを十分に持っています、特に推論に関して。

エヌビディアは推論ソフトウェアにおける優位性は比較的小さいものの、彼らのハードウェア性能は現時点で最も優れています。これは、資本コスト、運営コストが低く、性能が高いことを意味します。もしエヌビディアが進歩を止めれば、その性能の優位性は今後も増加しなくなり、他の競争者にチャンスが生まれます。

例えば、今Blackwellの発売により、エヌビディアは以前の製品よりも推論性能が10 - 15倍向上しており（大規模モデル向けに最適化）、競争に対応するために利益率を低下させました。彼らは毎年5倍以上の性能向上を計画しており、これは非常に速いペースです。同時に、AIモデル自体も進化を遂げ、コストも下がっており、これは需要をさらに刺激します。

ビル：ソフトウェアがトレーニングと推論で異なる役割を果たすとおっしゃいましたが、詳しく説明していただけますか。

ディレン：多くの人がエヌビディアのソフトウェアを単純にKutaと呼んでいますが、実際には多くのレイヤーを含んでいます。

トレーニングに関しては、ユーザーは通常エヌビディアのソフトウェア性能に依存します。研究者は新しい方法を試すことに専念しており、性能を最適化する時間がほとんどありません。

一方で、推論においてはマイクロソフトのような企業が限られた数のモデルを展開し、おおよそ6ヶ月ごとにモデルを更新しています。彼らは他のハードウェアでのこれらのモデルの運用性能を最適化するために、多くのエンジニアを投入することができます。例えば、マイクロソフトはAMDのような企業のハードウェア上でGPTスタイルのモデルを展開しています。

司会者：以前に触れたグラフがあります。それは今後4年間に1兆ドルの新しいAI作業量と1兆ドルのデータセンターの置き換え作業量があることを示していますが、これについてどう思いますか？人々が英伟达のGPUを使用してCPUデータセンターを再構築しないだろうと考える人もいますが、この見解にどう応えますか？

ディラン：英伟达は長い間、非AIワークロードにおけるアクセラレーターの使用を推進してきました。例えば、プロフェッショナルビジュアライゼーションの分野（ピクサーが映画を制作するなど）や、シーメンスのエンジニアリングアプリケーションなどではGPUが使用されています。

これらはAI分野においてはごく一部ですが、確かにアプリケーションは存在します。データセンターの置き換えに関しては、AIが急速に進化しているものの、従来のワークロード（ネットワークサービスやデータベースなど）はそれによって停止したり、遅くなったりすることはありません。データセンターのサプライチェーンは長く、構築期間も長いという現実的な問題があります。

例えば、インテルのCPUは過去数年の進展が遅れ気味ですが、AMDの登場はより高い性能の選択肢を提供しました。多くのアマゾンドットコムのデータセンターの古いインテルのCPUサーバーは何年も使用されてきましたが、今では128コアや192コアのようなより高性能な新しいサーバーに置き換えられます。これにより性能が向上するだけでなく、同じ電力消費の下でサーバーの数を減らすことができ、AIサーバーのためのスペースを確保できます。

したがって、データセンターの置き換えの事例はあるものの、市場全体は依然として成長しています。ただし、AIの発展がこの行動を促進しているため、企業はAIアプリケーションをサポートするためにより多くの計算能力を必要としています。

司会者：これは先週サシャが番組で言及したことを思い出させます。彼は彼らがデータセンターと電力の制限に直面していると言っていましたが、これはチップの制限ではありません。あなたはこれが先ほどの説明とどのように関連していると思いますか？

ディラン：私はサシャの見解が、データセンターと電力が現在のボトルネックであることを強調していると思います。これはチップの供給状況とは異なります。データセンターの構築と電力供給が逼迫する中、企業はリソースをより合理的に計画する必要があります。これが、彼らが暗号資産のマイニング会社から電力を調達したり、古いサーバーの減価償却期間を延長したりするような対策をとる理由を説明しています。

データがない場合、合成データを生成してモデルを改善することができます。

司会者：代替エヌビディアの提案を話し合う前に、まずあなたが記事で言及したプリトレーニングとスケールに関する議論についてお話ししましょう。イリアットはデータがAIの「化石燃料」であり、私たちはすでに大部分を消費したので、プリトレーニングの巨大な利益は再現されないと言っています。この見解についてどう思いますか？

ディラン：プリトレーニングのスケールの法則は比較的単純です。計算資源を増やすことでモデルの性能を向上させることができますが、これはデータとパラメーターの2つの次元を含みます。

データが尽きた場合、モデルの規模を拡大することは可能ですが、利益は減少するかもしれません。ただし、現在のところ、動画データの利用は非常に限定的で、これは誤解です。実際、テキストは現在最も効果的なデータ領域ですが、動画データにはより多くの情報が含まれています。さらに、プリトレーニングはモデルのトレーニングの一部にすぎず、推論時間の計算も重要です。データが尽きた場合、OpenAIなどの企業が試みている方法のように、合成データを創造することでモデルを改善し続けることができます。これはモデルが大量のデータを生成し、機能検証を行い、有効なデータをフィルタリングしてトレーニングに使用することによって、モデルの性能を向上させる手法です。この方法は現在まだ初期段階にありますが、投入される資金は比較的少なく、モデルの改善に対する新しい方向性を提供しています。

司会者：投資の観点から見ると、エヌビディアは非常に注目されています。しかし、プリトレーニングの利益がほとんど得られた場合、なぜ皆がより大きなクラスターを構築しているのでしょうか？

ディラン：プリトレーニングの一度きりの巨大な利益は過去のものになったかもしれませんが、計算資源を増やすことで、特に競争が激しい環境では、モデルの性能を向上させることで競争力を維持したい企業にとって、ある程度の利益を得ることができます。

さらに、モデルと競合他社のモデルとの比較も、企業が継続的に投資を行うよう促しています。投資回収率の観点から見ると、規模を拡大し続けることは対数的に高価かもしれませんが、それでも理性的な決定である可能性があります。なぜなら、利益は依然として存在しますが、獲得の難易度が増しているからです。さらに、合成データ生成などの新しい方法の登場により、モデルの改善速度が加速する可能性があり、それも企業が引き続き投資する動機を提供します。

司会者：では、どの分野において合成データが最も効果的ですか？具体例を挙げていただけますか？

ディラン：合成データは機能検証ができる領域で最も効果的です。たとえば、グーグルのサービスでは、システムが正常に機能していることを確認するために大量の単体テストが行われています。これらの単体テストは、LLMが生成した出力が正しいかどうかを評価するために使用できます。

数学や工学などの分野では、出力は明確な基準を用いて評価できますが、芸術、ライティングスタイル、交渉技術などの主観的な分野では機能検証が非常に難しいです。なぜなら、これらの分野の評価基準は比較的主観的だからです。例えば、画像生成の分野では、どの画像がより美しいかを言うのは難しいです。なぜなら、それは個々の好みに依存するからです。一方、数学的計算や工学設計では、出力が正しいかどうかを明確に判断できます。

ウォール街は大型データセンターの資本支出を過小評価しています。

司会者：あなたは超大規模データセンターから何を聞きましたか？彼らは皆、来年の資本支出（capex）が増加すると言っており、より大きなクラスターを建設していますが、それは本当ですか？

ディラン：私たちのトレールと分析によると、ウォール街のcapexの推定は通常低く見積もられています。私たちは世界のすべてのデータセンターを追跡しており、マイクロソフト、Meta、アマゾンドットコムなどの企業がデータセンターの容量に非常に大きな支出をしていることがわかります。

彼らは来年のデータセンターリース契約を締結しており、Cloud Computing Serviceの収益は加速的に成長する見込みです。なぜなら、彼らは現在データセンターの容量に制限されているからです。これは、規模を拡大することで競争に勝てると信じていることを示しており、だからこそ継続的に投資しています。

司会者：以前に言及した事前学習の大規模クラスター構築についてですが、事前学習のトレンドが変わった場合、彼らの推論に関する構築はどのように変化するのでしょうか？

ディラン：神経ネットワークを訓練する際、前向き伝播はデータを生成するために使用され、後向き伝播は重みを更新するために使われますが、合成データ生成、出力評価、モデル訓練の新しいパラダイムでは、前向き伝播の計算量が大幅に増加します。なぜなら、大量の可能性を生成する必要があるからです。反対に、後向き伝播の計算量は相対的に少なく、効果的なデータの少数でのみ訓練が行われます。これは、訓練中に大量の推論計算が行われていることを意味し、実際に訓練中の推論計算量はモデルの重みを更新する計算量よりも大きいです。

さらに、モデルを訓練する際にすべてのコンポーネントが同じ位置にある必要があるかどうかは具体的な状況に依存します。

例えば、マイクロソフトは異なる地域に複数のデータセンターを構築しています。なぜなら、推論作業負荷を異なるデータセンターに分配し、他の場所でモデルを更新することで、リソースをより効率的に活用できることを発見したからです。したがって、事前学習のパラダイムは鈍化しておらず、各世代の改善コストは対数的に増加していますが、企業はコストを削減し、効率を向上させる他の方法を模索しています。

エヌビディアは2000年のシスコではありません

司会者：英伟达とシスコが2000年の状況に比較されることがありますが、どう思いますか。

ディレン：この比較にはいくつかの不公平な点があります。シスコの収入の多くは、テレコムインフラの構築に対する民間投資/クレジットから得られていますが、エヌビディアの収入源は異なり、民間投資/クレジットの割合は小さいため、CoreWeaveはマイクロソフトによってサポートされています。

さらに、インターネットバブルの時期には、この分野に入る民間資本の規模は現在よりもはるかに大きかったです。現在のベンチャーキャピタル市場は活発に見えるものの、実際には中東の主権富裕基金などの民間市場からの資金はまだ大量には入ってきていません。また、当時のシスコと比べて、現在のこれらの収益性のある会社の資本源、正のキャッシュフロー、および投資の合理性には違いがあります。エヌビディアの現在のPERは30で、当時のシスコの120とは大きな差があるため、単純に比較することはできません。

推論時間推論（inference time reasoning）は、インテリジェンスを拡張する新しい方向性です

司会者：推論時間推論がインテリジェンスを拡張する新しい方向性であり、計算集約度が事前学習よりも高いとおっしゃいましたが、詳しく説明していただけますか。

ディレン：事前学習は収益逓減やコスト過多の問題に直面する可能性がありますが、合成データ生成や推論時間計算が新しい発展の方向性になっています。

推論時間の計算は、モデルのトレーニングに余計なコストをかける必要がないため、良さそうに聞こえますが、実際には大きなトレードオフがあります。例えば、GPT - 4o の場合、推論中に大量のデータが生成されますが、最終的にユーザーに出力されるのはその一部だけです。このプロセスでは、モデルが大量の計算リソースを消費する必要があります。

例えば、ユーザーのリクエストを処理する際、モデルは数千の中間結果（トークン）を生成する可能性がありますが、最終的にはユーザーに対して数百しか出力しません。これは、生成されたトークンの数が増えるだけでなく、これらのトークンを処理する際に、コンテキスト情報（KVキャッシュなど）を保存するためにより多くのメモリが必要となり、その結果、サーバーが同時に処理できるユーザーリクエストの数が減少し、各ユーザーのコストが増加することを意味します。

コストの観点から見ると、マイクロソフトのような企業にとって、もし推論収益が100億ドルで、粗利率が50-70%、コストが数十億ドルの場合、GPT - 4oのようなモデルを使用する際には、推論計算コストの増加によりコストが大幅に上昇する可能性があります。モデルのパフォーマンスが向上し、より高い料金を請求できるとしても、コストの増加幅が収益の増加幅を上回る可能性があります。

GPT - 4oモデルの企業向け需要は過小評価されています。

司会者：では、GPT - 4oのようなモデルに対する市場の企業向け需要は過大評価されていますか、それとも過小評価されていますか。

ディラン：GPT - 4oは現在まだ初期段階にあり、人々の理解と適用はまだ不十分です。

しかし、現在のいくつかの匿名のベンチマークテストから見ると、グーグルやAnthropicなど多くの企業が推論モデルの開発を進めており、計算リソースの増加を通じてモデルパフォーマンスを向上させる明確な道を見出しています。これらの企業は推論への投資が比較的少なく、まだ始まったばかりですが、今後6ヶ月から1年の間に、機能確認済みのベンチマークテストにおいてモデルパフォーマンスが大幅に向上することが期待されています。したがって、この種のモデルに対する市場の需要ポテンシャルは巨大ですが、現時点では正確に評価することは難しいです。

司会者：インターネットの波を振り返ると、多くのベンチャー企業は初めにオラクルやサンマイクロシステムズの技術に依存していましたが、5年後には状況が変わりました。AIチップの分野でも同じことが起こるのでしょうか。

ディレン：現在、GPT-4oは非常に高価ですが、モデルの規模を縮小すれば、コストは大幅に下がります。

例えば、GPT-4oからLlama 7bに移行すると、コストを大幅に削減できます。小型モデルの場合、推論は比較的容易で、単一のチップ上で実行できるため、市場競争が激しく、多くの企業がLlamaなどのモデルに基づくAPI推論サービスを提供しており、価格競争が激しく、利益率は低いです。

対照的に、MicrosoftのようにOpenAIモデルを使用する企業は、粗利率が高い（50 - 70％）です。彼らは高性能なモデルを持っており、企業や消費者が高額な料金を支払う意欲があります。

しかし、より多くの企業が市場に参入するにつれて、モデルの差別化がますます重要になります。最良のモデルを持ち、支払う意欲のある企業や消費者を見つけることができる企業だけが、競争の中で際立つことができます。したがって、市場は迅速に選別され、最終的にはこの分野で競争できるのはごくわずかの企業に限られる可能性があります。

Googleとアマゾンのチップにはそれぞれ利点と欠点があります。

ホスト：これらの競争企業の中で、AMDの状況はどうですか？

ディレン：AMDはチップ設計で素晴らしいパフォーマンスを発揮していますが、ソフトウェアの面では明らかな不足があります。彼らは十分なソフトウェア開発者を欠いており、ソフトウェアを開発するためにGPUクラスタを構築するために資金を投資していません。これはエヌビディアと明確に対照的です。

さらに、AMDはインテルとの競争に重点を置いており、システムレベルの設計経験が不足しています。ZTシステム会社を買収しましたが、大規模データセンターのシステムアーキテクチャ設計においてエヌビディアに後れを取っています。

超大規模データセンターの顧客（Metaやマイクロソフトなど）は、AMDがソフトウェアを改善し、モデルの開発や推論経済を理解する手助けをしているが、AMDは依然としてエヌビディアと同じタイムテーブルで競争することはできない。来年、AMDはマイクロソフトやMetaなどの顧客のAI収入シェアが減少すると予測されているが、市場から利益を得ることはできる。しかし、エヌビディアのような大きな成功は収められない。

司会者：グーグルのTPUの状況はどうですか？エヌビディアに次ぐ選択肢のようです。

ディレン：グーグルのTPUは、システムとインフラストラクチャの面で独自の特長があります。単体のTPUの性能は良好ですが、より重要なのはそのシステム設計です。グーグルはブロードコムと協力してTPUシステムを構築しており、チップの相互接続、ネットワークアーキテクチャ等の面で競争力があり、エヌビディアを上回る部分もあります。

さらに、グーグルは長年にわたり水冷技術を採用し、システムの信頼性を向上させてきましたが、エヌビディアは最近になってようやく水冷技術の必要性に気づきました。

しかし、グーグルのTPUは商業的成功が相対的に限られている主な理由は、ソフトウェアが十分にオープンではないことにあります。多くの内部使用のソフトウェア（DeepMindが使用するソフトウェアなど）はグーグルクラウドのユーザーに提供されていません。

価格設定については、公式の価格は高いですが、実際の交渉後の価格には競争力が欠けており、他のCloud Computing Service提供者（オラクル、マイクロソフト、アマゾンドットコムなど）と比較して、グーグルのTPUの価格には優位性がありません。

さらに、グーグルは大量のTPUを内部サービス（検索、Geminiアプリなど）に使用しており、外部のレンタル市場のシェアは小さく、主要な顧客はアップルです。また、アップルがTPUをレンタルすることは、エヌビディアに対する姿勢に関連があるかもしれません（競争関係がある可能性がありますが、具体的な理由はまだ述べられていません）。

司会者：では、アマゾンドットコムはどうですか？グーグルのTPUのように詳細にアマゾンドットコムのチップについて紹介してもらえますか？

ディレン：アマゾンのチップは「アマゾンベースTPU」と呼ぶことができます。いくつかの点でコスト効果の利点があり、例えばより多くのシリコンとメモリを使用し、ネットワーク能力はTPUと一定の比較ができますが、効率の面で不足があり、より多くのアクティブケーブルを使用する（ブロードコムと提携しているグーグルTPUはパッシブケーブルを使用しています）、シリコンチップの面積使用効率が低いなどです。

しかし、アマゾンはコストを削減することによって、HBMメモリ帯域幅とドルあたりのコストについて優位性を持っており、そのチップの価格はエヌビディアよりも大幅に低くなっています。技術指標（メモリ、帯域幅など）ではエヌビディアに劣りますが、コストに敏感なアプリケーションにとっては魅力的です。

アマゾンはAnthropicと協力して40万個のチップを含むスーパーコンピュータシステムを構築しました。彼らは、大規模なチップ展開が推論およびモデル改善に役立つと信じており、技術的には最先端ではないかもしれませんが、コスト効果がアマゾンにとって合理的な選択にしています。

来年の資本支出は明確ですが、26年後に不確実性があります。

司会者：2025 - 2026年を展望すると、半導体市場についてどのように考えていますか？例えば、ブロードコムの最近の株価上昇、エヌビディアの株価変動について、市場はどのように発展すると考えていますか。

ディレン：ブロードコムはカスタムASIC分野でいくつかの成果を上げており、グーグルなどの会社からの複数のカスタムASICの注文を獲得しています。グーグルは特に推奨システムのパフォーマンスを向上させるために努力しています。また、OpenAIなどの会社も独自のチップ開発を行っており、アップルも一部のチップをブロードコムと共同で生産しています。これらの発展状況は、市場競争がますます激化することを示しています。

市場全体から見ると、超大規模データセンターは来年支出を大幅に増加させる予定であり、これがネットワーク機器サプライヤー、ASICサプライヤー、システムサプライヤーなどを含む半導体エコシステム全体の発展を促進するでしょう。

しかし、2026年の状況には一定の不確実性があります。

一方で、モデルの性能が持続的に向上するかどうかが鍵となる要因となるでしょう。モデルの性能向上の速度が鈍化すると、現在市場の成長がモデル性能の継続的な進歩とそれに伴う計算リソースの需要増加に大きく依存しているため、市場の調整を引き起こす可能性があります。

もう一方で、資本投入も重要な変数です。現在、中東の主権 Wealth Fund、シンガポール、北欧およびカナダの年金基金などはまだ大規模に市場に参入していませんが、将来的に大量の資金を投入することを決定すれば、市場に重大な影響を及ぼすことになります。

さらに、新しいクラウド市場は統合に直面しつつあります。現在追跡している約80社の新しいクラウドサービスプロバイダーの中で、競争に生き残る可能性があるのはごく少数（5 - 10社）です。そのうち5社は主権クラウドサービスプロバイダーで、残りの約5社は市場競争力を持つ企業です。

現在、GPUリース市場の価格は急速に変化しています。例えば、エヌビディア H100 のリース価格が大幅に下落しており、新しいクラウドサービスプロバイダー間の競争が激しいだけでなく、アマゾンドットコム等の大手クラウドサービスプロバイダーのオンデマンド GPU 価格も急速に低下しています。企業が GPU クラスターを購入する比率は依然として相対的に低く、彼らは GPU 計算の需要を新しいクラウドサービスプロバイダーにアウトソーシングする傾向がありますが、市場の統合が進むにつれて、この状況は変わるかもしれません。

エヌビディアにとって、競争はあるものの、技術的に先行し続け、性能が優れ、コストが低い製品を投入できれば、市場で主導的な地位を占める機会が依然としてあります。例えば、彼らが近日中に発売する予定の製品は前代の製品よりもコストが高いですが、性能の最適化と価格戦略を調整することで、成長を実現する可能性があります。しかし、市場の需要が期待通りに増加しない場合や、より競争力のある代替品が現れると、エヌビディアの収益に影響が及ぶ可能性があります。

司会者：ディレン、本日のシェアに感謝します。これにより、半導体業種における AI 分野の進展についてより深く理解できました。今後もこの分野の動向に注目し、各社がこの機会と挑戦に満ちたマーケットでのパフォーマンスを観察できることを期待しています。もう一度ありがとうございました！

ディレン：ありがとうございます。ここで私の見解をシェアできて嬉しいです。

司会者：皆さんにお知らせしますが、上記の内容は私たちの見解を表すものであり、投資アドバイスを構成するものではありません。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。更に詳しい情報

SemiAnalysis创始人深度对话：AI新时代，英伟达会不会被挑战？