①「2ドル/時でH100をレンタル:gpuバブルが破裂する前夕」という報道が国内市場で大きな関心を引いている。②モルガンスタンレーは、エヌビディアのBlackwellシリーズgpuの将来の1年分の供給が既に完売しており、黄仁勋は既存のデータセンターが1兆ドルのgpuアップグレードを必要としていると述べています。③H100のレンタル価格が下落し、本当に「gpuバブルが破裂する」と同じくらい深刻な状況でしょうか?
《科創板デイリー》10月14日版によると、一部の記事が「2ドル/時でH100をレンタル:gpuバブルが破裂する前夕」という内容で国内市場の高い関心を呼んでいます。関連記事によると:
エヌビディアのH100 gpuは2023年3月に発売された後、需要が急増し供給不足となり、レンタル価格が最初の1時間あたり4.7ドルから8ドル以上に急騰しました。しかし、今年に入ってから、H100は「供給過剰」となり、1時間あたりのレンタル価格が2ドル前後に下落しました。
価格の下落は複数の要因によるものです:1)H100を長期予約していた一部企業がモデルトレーニングの完了後に、未使用の計算リソースを転売する。2)多くの企業が新しいモデルのトレーニングをやり直すのではなく、既存のモデルを微調整し、計算リソースの需要が大幅に低下している。3)大規模な基本モデルの構築に焦点を当てる新興企業の数が大幅に減少している。4)AMDやインテルのgpuなど、H100の代替品が登場しています。
この報道を追跡すると、海外の主要メディアや主要なテクノロジーメディアはまだ関連報道を行っていません。原報道のタイトルは「$2 H100s: How the gpu Bubble Burst」(2ドルのH100: gpuバブルがどのように破裂したか)で、Latent Spaceというサイトから発信されたもので、原文の著者はEugene Cheahです。
Latent Spaceは、AIに焦点を当てたサイトで、情報、ブログ、コミュニティを兼ね備えており、swyxとAlessio Fanelliによって運営されています。swyxのソーシャルメディアアカウントには具体的な自己紹介がなく、Alessio Fanelliは初期のベンチャーキャピタル企業Decibel VCのパートナー兼CTOです。

原文の著者Eugene Cheahは、初期の会社Featherless.AiのCEOです。

Cheahは「gpuバブル」の記事の末尾で、Featherless.Aiが現在、世界最大のオープンソースAIモデルをホストしており、「月額10ドルから、即時アクセス、無制限のリクエスト、固定価格;高価な専用gpu不要でサーバーレス方式によるリアルタイム推論が可能」と述べています。
▌H100のリース価格が下落しています。gpuバブルが崩壊したのでしょうか?
「GPUバブル」の原文には、法国の芸術家ジャン=レオン・ジェロームによって1882年に創作された絵画「郁金香の熱狂」(ル・デュエル・ア・ラ・リピエ)が含まれています。
この絵は、歴史上初めて記録された投機バブルである17世紀オランダの「郁金香熱」を描いており、1634年に郁金香の価格が持続的に上昇し、1637年2月に崩壊し、投機家達は元の投資額のわずか5%しか手に残りませんでした。

300年以上前の投機バブルが再演される可能性はあるのでしょうか?この問題は、すべてのAI投資家の神経を揺さぶり、おそらく今回の「H100のリース価格の下落」がAIコミュニティで高い関心を引いた理由でもあります。
Vast.aiのウェブサイトの報告によると、1x H100の1時間あたりのリース価格は実際に2〜3ドルの範囲内にあります。

Vast.aiの報告
しかし、H100のリース価格の下落は本当に「GPUバブルの崩壊」と同じことを意味するのでしょうか?
一方、Eugene Cheahの記事から、「H100価格の下落」はおそらく「分化」と表現するのが適切である可能性があります。持続的な下落は主に小規模クラスタのリース価格に集中しており、一方で、大規模計算リソースクラスタの価格は比較的高い水準を維持する可能性があります。
そして、これらの大規模な計算リソースクラスターの背後には、テスラ、マイクロソフト、OpenAIなどのテクノロジージャイアントが多く存在しています。Omidiaのデータによると、H100がリリースされた2023年第3四半期に、出荷台数が65万枚に達し、そのうちMetaとマイクロソフトだけでそれぞれ15万枚を獲得し、ほぼ半数を占めました。
一方、電子製品は全て更新サイクルがあり、gpuチップも同様です。以前、次世代GPU Blackwellシリーズに欠陥があるという設計が報じられ、出荷が遅れる可能性があるとされていました。しかし、先週、モルガンスタンレーが報告書を発表し、Blackwellの生産は「計画通り進行中」であり、今後約12か月の供給はすでに完売しており、今注文する顧客は2025年までに商品を受け取ることになります。「これは既存のHopperアーキテクチャ製品への引き続く強力な短期需要を促進する」と述べています。
H100のリース価格が急激に下落したわけではなく、数日間の変動がありました。A100からH100、そしてH100からH200、そして将来のBlackwellへ、新製品の登場は前世代の製品の没落をもたらすことになり、さらにBlackwellの計算リソースコストがHopperをさらに下回る可能性があるという空想もあります。
英ビディアの「舵取り人」である黄仁勲も最近姿を現しました。Altimeter Capitalの取材を受ける際、彼は英ビディアの将来に対する強気な見通しはインターネットバブルの頂点期に思科を巡る熱狂とはまったく異なると強調しました。英ビディアは「計算の再構築」を進め、将来は「高度な機械学習」の時代になるでしょう。
「ムーアの法則は基本的に終了した」と述べ、未来の計算密度の高いソフトウェアに追いつくために必要な計算リソースを提供するために、今後4〜5年以内に既存のデータセンターは約1兆ドルのGPUが必要になるでしょう。
「AIバブル」論の警告が繰り返し行われ、「AI投資の収益率が期待に達しない」という疑問の声が高まり、一方ではOpenAIが算力のオンライン化の遅れについて不満を言い、英ビディアの新製品が完売している一方、他方では算力のリース価格が継続的に下落し、会社がGPUを「売り払う」状況も存在しています。
しかし、局所的で短期的な算力の過剰または不足は、AI全体の状況を代表するのが難しいように思われます。供給と需要の両者、ロングとショートの両側がAI分野で取引を繰り返す中で、ハードウェア以外にも新しいストーリーが急がれるかもしれません。