ログアウト
donwloadimg

アプリをダウンロード

ログイン後利用可能
トップに戻る

SemianalaysisのBlackwell問題の解説記事めちゃくちゃ詳しい問題箇所は熱歪みによる2つのBlackwell NVLINK C2C、修正はシリコンの数レイヤーの配線とブリッジチップのバンプそしてCoWoS-Lの大量生産H200延命とGB200

これ分かりやすい
以下、一部抜粋

NVIDIAのBlackwellシリーズは、製造上の問題により、生産スケジュールが大幅に遅れています。特に、最も技術的に進んだGB200チップが課題となっています。TSMCの新しいCoWoS-L技術を使用しているため、パッケージングや供給に問題が発生し、NVIDIAはこれに対応するため、システムの再設計を行っています。

主な要点は以下の通りです:

1. **生産遅延の影響**:2024年後半から2025年前半にかけての生産目標に影響が出ています。
2. **技術的な課題**:特にGB200チップのパッケージング問題が深刻です。
3. **システム設計の変更**:新しいシステム(例: B200A)が登場し、低~中範囲のAIシステム向けに対応します。

詳細に見ると、GB200チップは、72GPUのラックあたり約125kWの電力密度で、従来のデータセンターよりもはるかに高い要求をしています。このため、システムレベルでの複雑さが増し、供給チェーン全体に影響を与えています。

さらに、NVIDIAは、新しいB200Aという代替GPUを導入しており、これはGB200に対する補完的な製品として機能し、特に中低範囲のAIシステム向けに使用される予定です。

**技術的課題と対応策**:
- **CoWoS-L技術の課題**:NVIDIAが使用するTSMCのCoWoS-L技術により、パッケージングに課題が発生し、生産が遅れています。CoWoS-Lは、より高性能なAIアクセラレータを実現するために必要ですが、製造の複雑さが増し、熱膨張係数の不一致による歪みが発生しています。
- **サプライチェーンの影響**:TSMCが新しい製造施設を建設中であるため、短期的には供給不足が続く見込みです。

これらの問題により、NVIDIAはHGXフォームファクターをキャンセルし、B200Aを使用したMGX NVL 36フォームファクターに移行しています。この変更により、低電力密度ラックを必要とするデータセンターや、液体冷却が難しい場所での展開が可能になります。

**市場への影響**:
- **ハイパースケーラー**:GB200 NVL72/36x2は引き続きパフォーマンスに優れたオプションですが、供給不足により、MGX NVL36へのシフトが見込まれます。
- **ネオクラウド市場**:多くのネオクラウドプロバイダーは、より低電力で空冷が可能なMGX NVL36を採用する可能性が高いです。

全体として、NVIDIAは新しい技術への挑戦とそれに伴う課題に取り組んでおり、これが市場やサプライチェーンに大きな影響を及ぼしています。
免責事項:このコミュニティは、Moomoo Technologies Inc.が教育目的でのみ提供するものです。 さらに詳しい情報
12
+0
2
翻訳
報告
29K 回閲覧
コメント
サインインコメントをする
  • 人生が含み損 : サンプル生産では可能だったのに、大量生産したら歪んだのね🥲
    それをTSMCの工程で解決しようとしたら、設備投資みたいになるから、設計変更でどうにかー🤔
    って感じかな?
    車とかでもよくある話
    しかも全くダメではなく、歩留りがわるいあたり、いけるときはいけちゃう悩ましさ
    がんばれー🌸🌸

  • Roxi_117 : 製品に5%を超える不良品が出ると、出荷企業の存続が危ぶまれる事になると、昔聞いたことがあります。Blackwellの「歩留」に問題がある旨、心配ですが、原因と対策を明らかにして期限までに解決されるのを祈ります。これだけが理由ではないと思います中、S&PのSKEW値(暴落への保険としてfar putに掛ける人が増えると上がる)が先週続伸して、159になっています。