今週、グーグルのCEOサンダー・ピチャイは、彼にとって数年ぶりの最も素晴らしい一週間を過ごしました。ノーベル賞授賞式から突破的な新しいAIモデルGemini 2.0、量子計算の突破まで、グーグルは大小さまざまな勝利を収めました。
最近、米国の新鋭メディアSemaforのテクノロジー編集者リード・アルバーゴッティがマウンテンビューでピチャイにインタビューを行いました。今年はピチャイがグーグルのCEOとして10年目にあたります。圧力の下でも、勝利に囲まれても、彼は常に冷静さを保っています。
2022年11月にChatGPTがリリースされて以来、グーグルの発展は厳しいものがありました。少なくとも外部から見るとそうです。従来の見解では、グーグルは何らかの理由でChatGPTの瞬間を逃したとされ、パニックに陥っています。しかし、ピチャイは、彼は会社の長期計画を一度も疑ったことはなく、最後まで戦い抜くことを選んだと述べています。
ピチャイはまた、ドナルド・トランプが来年ホワイトハウスに入る際、彼は米国の新政府のAI「マンハッタン計画」に積極的に参加すると述べました。
以下はインタビュー内容の要約です:
質問:グーグルにとって、これはとても過酷な一週間であり、すべての製品発表、量子計算の突破、ノーベル賞、そして新しいAIモデルGemini 2.0があります。これはすべて計画されていたのですか、それともAIの狂気によるものですか?
ピチャイ:2015年、私は会社をAI優先の方向に進めるようにしました。その一環として、私たちは世界クラスの研究を始め、AIに対して深く全栈的な研究を行い、基盤インフラを構築することを述べました。そして、私たちの開発者のためにモデルを構築し、それを私たちの製品に組み込みます。この深い投資は、私たちが会社として、グーグルとアルファベットとして行っているすべてのことに浸透しています。これは基盤であり、深い技術革新の手法を取り、全栈的なアプローチを採用しています。そして、現在の生成型AIの時代において、時には事を事前に行うために投資を行います。私にとって、それはグーグルDeepMindをゼロから立ち上げ、Geminiを起動し、それをネイティブのマルチモーダルと長文コンテキストとして構築し、今は2.0バージョンに入ることです。
だから、基盤を固めて、チームを調整し、会社を設立する必要があります。あなたはこれらの利益が消費者に提供され始めたことに気付いていると思います。固定費が常にあるので、私たちの速度はさらに速くなると予想しています。私たちが構築したいモデルを構築するために、TPUを大規模に準備する必要があります。データセンターを建設し、適切なチームを組織します。イノベーションのパイプラインは非常に力強いと感じています。そのいくつかは長期的な賭けであり、完了するのに時間がかかります。私の見解では、量子コンピューティングは2010年頃のAIのようなものです。これに関して知っている人は少なく、あなたはそれを着実に処理しています。それは同じことです。Waymoについては、私たちは15年の歴史を歩んできました。これはエキサイティングな瞬間であり、これはすべての結合の可能性があります。ノーベル賞は計画されたものではありませんが、これが起こったときに私はこの言葉を言いました:私はDemis HassabisとJohn Jumper(2024年ノーベル化学賞受賞者)、彼らのチーム、そしてAlphaFoldでの仕事を見ることができて光栄です。これはまさにノーベル賞の作品です。だから、これはおまけです。
質問:一、二年前、人々は谷歌がChatGPTに打ち負かされたと言っていました。そして今週は、あなたが会社でどれほどの進展を遂げたか、そして人々が谷歌についてどう考えているかを確認するのに良いタイミングです。今、あなたは違う気持ちですか?
Pichai:これはエキサイティングな瞬間です。社内では、私たちが達成している進展を明確に感じています。AIモデルを研究する際、すべての損失曲線(loss curve)やモデルの能力を目の当たりにします。さまざまなベンチマークがそれを証明しています。私たちは世界クラスの人材を持ち、最先端のリソースを得ることができます。谷歌DeepMindと谷歌研究(Google Research)の統合は、現在の生成的AI分野で最も引用されています。私たちは、この革命が起こっている多くのブレイクスルーに責任を持つでしょう。この勢いを見て、私たちは確かに非常に満足していますが、もっと多くのことを計画しており、これはほんの始まりです。
質問:あなたは先週、ニューヨークタイムズのDealBook会議で、AIの進展がますます困難になり、低い果実は既に摘み取られたと言いました。これはどういう意味ですか?摘み取られた低い果実とは何ですか?本当に困難なのは何ですか?
Pichai:私の答えを明確にするために、私はそこでもう一度言いました。実際、私は未来の進展に非常に興奮しています。私の言いたいことは、この分野では計算を投入し、初期の進展を得ることができるということです。しかし、これは単にスケールアップの問題だけでなく、突破を実現することでもあります。したがって、私たちのモデルを200万のトークンまで入力長として使用することが重要です。これは長いコンテキストの一例です。Gemini 2.0を使用して、私たちはマルチモードのリアルタイムAPIを持っているので、今それはローカルの画像と音声出力が可能です。ストリーミングをサポートし、ユーザーがモデルの出力をリアルタイムで見ることができるようになります。すべての応答が生成されるまで待つ必要はありません。これらはすべて突破です。次の段階に入るときには、より洞察に満ちた突破が必要です。この仕事の質はかなり高いと思います。私は、これが本当にエリートチームを区別するのに役立つと思います。ただ私たちだけでなく、他のいくつかのチームもあり、2025年はもっとエキサイティングになるでしょう。
質問:私は理解しましたが、人々は誤解しています。外部の理解は、あなたたちの発展が安定期に入ったか、さらには停滞期に入ったということです。しかし、あなたが言いたいのは、谷歌にとって、物事が難しくなるときにこそ大きな成果を上げられるということですか?
Pichai:その通りです。Waymoも同じです。多くの人々がこの問題を解決しようと努力していますが、その後、より困難になりました。それがより困難になると、それを克服して次のレベルに達することが重要です。
質問:人々は過去2年間の進展を曲線として捉えがちです。そのように見ると、確かに私たちは安定期に達しているように見えます。しかし、視野を狭めてその曲線を見ると、停滞の場面がいくつか見えると思います。ここからどこに進むと思いますか?これは同じトレンドですか?
ピチャイ:2010年頃のことを今でもはっきりと覚えています。このモデルがほとんど画像を認識できないことに気づいて、興奮しました。この10年間、進歩は容赦ありませんでした。今では、この分野により広い一般の人々が参入しており、主流と言えるでしょう。しかし、2025年を展望したとき、現在すでに十分な機能モデルが存在していると思います。これに基づいて多くのユースケースを構築できるでしょう。
この進展は非常にリアルなものになるでしょう。Gemini 2.0を用いて、私たちはそれをよりエージェント的にするための基盤を築いています。まだ研究の範囲内ですが、私たちは信頼できるテストユーザーに渡しました。例えば、Project Marinerは、最初からChrome上で動作しています。ブラウザーを使ってモデルが機能するのを見るのは非常に素晴らしいことですが、いくつかの障害を乗り越えなければなりません。なぜなら、この分野では安全で信頼できる方法で実行する必要があるからです。俗に言うように、「最後の20%には80%の努力が必要です」。この場合、最後の10%には90%の努力が必要かもしれません。しかし、だからこそ基準を設けたいのです。進展を遂げています。信頼できるテストユーザーに渡しています。これにより、責任を持ってテストを行い、フィードバックを得て、そしてそれをより多くの人々に提供することができます。しかし、AIが世界中のすべてのワークフローに影響を与え始めることを考えてみてください。私たちは実際に、これまでよりも大きな進展を目にするかもしれません。両方が同時に真実です。
質問:長期的な戦略について言えば、最初からGeminiとのマルチモードでの協力が、他のいくつかの能力(おそらく言語やコーディングに関して)を犠牲にしているように見えますが、そうですか?
ピチャイ:Gemini 1.2を発表する際、最初からマルチモードになることを本当に望んでいました。私たちのモデルはマルチモーダルの面ではほぼ最先端だと思っていますが、まだモデルの能力を示していません。ローカル画像出力や音声出力はありません。2.0バージョンでは、これらの機能をアンロックしていますが、その一方で、すべてのコーディングや推論などにおいても最先端です。SWE基準の下で、私たちのモデルは現在最先端です。まだ公開されていない他の実験モデルがあり、これらもさらに多くの機能を示しています。確実に最前線を推進していますが、責任を持ってそうするつもりです。だからこそ、一部のものは信頼できるテストモードにあり、一部はただの開発者向け実験APIに過ぎないのです。私たちはフィードバックを得るために努力し、それを新しいレベルに引き上げるつもりです。
質問:DeepMindの人がこのことを言及し、理論を提唱して、マルチモーダルアプローチがAGIへの道であると考えています。世界モデルを持つ必要があり、特定のAIが本当に推論し理解するために必要なのかもしれません。あなたの進展の中で、それが本当だとわかりましたか?それが正しいアプローチだと考えますか?
ピチャイ:人間として私たちが世界と体験するのは非常に多様なモードがありますので、それは常に意味があります。だからこそ、Google Lensを使用して検索するのです。見るものに対してスマートフォンを向けて質問することができるのなら、常にタイピングする必要はありません。Lensは毎月数十億回のクエリを私たちにもたらし、これは私たちの成長が最も早いユースケースの一つです。私はこれが未来の発展の方向であるということをはっきりと示しています。デミスと彼のチームは常に強いビジョンを持っています。このすべての一部として、私たちが導入した一つのことは、これを使ってゲームを助けることができます。もしあなたが新しいプレーヤーであれば、何をしているのかに注目し、フィードバックを提供するために会話します。これはその基本だと思います。長期的には、ロボティクスのようなものを見たとき、特にWaymoにとって非常に重要になるでしょう。Waymoは周囲の世界を見て、決定を下すことです。私たちが行っているネイティブなマルチモーダルモデルの作業はWaymoと交わり、時間と共にWaymoをより良くするでしょう。
質問:数十億人にこれらのマルチモード製品を渡したとき、Astraを見て、それが広く利用可能になれば、本当に優れたトレーニングデータソースになりますか?これはGoogleにとってメリットでしょうか?
ピチャイ:私たちが行っているすべてのことの中で、実世界のフィードバック以上に良いものはありません。人々はGoogle Lensを使って検索し、Astraを使用しています。良性のサイクルが私たちの製品にとって非常に重要になると思います。これらすべてが私たちの製品をより良くすると思います。たとえば、Waymoについて見れば、私たちは多くをシミュレーションし、その後現実世界で運転しました。しかし、今、私たちは実世界で都市に展開し、毎週17.5万回の移動サービスを提供し、約100万マイルを走行しています。これはあなたが製品を創造的に改善するための最良の方法だと考えています。
質問:来年は10の都市があります。これはすぐに実現します。これが本当の収入源になると思いますか?基準は何ですか?マイルごとに料金がかかりますか?
ピチャイ:今のところ、私たちが測定している基準は、汎用のWaymo運転プログラムを構築していることを確認することです。私たちが採用できるケースが増えるほど、規模が拡大し、それにより都市環境、高速道路、すべての気象条件で高い基準で安全に機能させることができます。その後、さまざまなシーンでそれを提供し(私たちの車両や、Uberや他の参加者とのコラボレーションと同様にパートナーと連携して)、スケールを拡大し、良好なユーザーエクスペリエンスを持つことが、私たちがこの問題に取り組む際に考慮していることです。
質問:私が考えもしなかったのは、データセンターの名前、例えばColossusやRainierです。カンザスシティには数十億ドルの価値があるデータセンターがあります。あなたはそのような大規模なクラスターを構築する予定ですか、それともすでに構築されていますか?名前はありますか?
ピチャイ:これからは、Geminiに私たちの命名を担わせるべきです。私たちはデータセンターの最新技術を推進しており、世界で最も強力なクラスターのいくつかを持っていると思います。世界の多くの地域で液体冷却を採用していることを誇りに思います。私たちはデータセンターで液体冷却を広く展開しており、すでにしばらくの間実施しています。私たちは、TPUだけでなく、エヌビディアと協力して、データセンターでGB200を取得する最初の顧客の一つになります。私たちは、地熱によって動力を得ているデータセンターも持っています。私たちのトップデータセンターの多くは、エネルギー使用において90%が無炭素です。したがって、私たちは先頭に立っており、規模を拡大しています。私が見たすべて、私たちが設定したベンチマークのすべてから、私たちも最前線にいると思います。
質問:しかし、あなたは他の人のようにそれについて話さないでしょう。アマゾンドットコムは、数十万のTrainium2チップを展開すると発表しました。あなたはTPUでGemini 2.0を訓練し、なぜそれについて大々的に話さないのですか?
ピチャイ:2017年か2018年のGoogle IOで、AI優先のデータセンターを構築し、私たちのTPUの部品を示したことを覚えています。私たちはすでにしばらくの間これを行っているかもしれません。私たちは行っていることに誇りを持っていますが、あなたの提案を受け入れ、もっと話すことを確実にします。
質問:これは商業機密である可能性があります。おそらく、あなたがリーダーである場合、話す必要はないのでしょう。それらが世界最大のクラスターの一部と見なされるもののいくつかを比較できますか?
ピチャイ:明確にする必要がありますが、いくつかの会社がこの作業を行っています。先端モデルのプレトレーニングに必要な大規模クラスターを生成するためには、同時に配置されることが理想的です。私はこの点で絶対に先頭に立っていると思います。私たちは、Google DeepMindや私たちのクラウド顧客が利用できる最大の計算クラスターのいくつかを持っています。私たちはそこでさらに進めるつもりです。
問:即将上任のトランプ政権はAIの「マンハッタン計画」を提案しました。これがどのようなものになるのか、またアルファベットがその中でどのような役割を果たすかについての所見はありますか?
ピチャイ:今はまだ時期尚早です。移行チームがそこにいますが、大統領は非常に明確に、技術のリーダーシップと重要なテクノロジーへの投資を望んでいると述べています。私の見解では、私たちは何年もそのようにしてきましたが、私たちは手助けを提供したいと考えています。量子コンピュータやAIに関する発表をご覧になったと思いますが、小型モジュール型原子炉を共同で建設するチームを発表しました。それらのいくつかは、大規模な実体インフラプロジェクトです。きっと国家として一緒に努力し、これらの野心的な大型プロジェクトを実施し、その段階に戻る機会があると思います。世界中の誰もがSpaceXのブースターがこのように戻って着陸するのを見ることに興味がないわけではありません。私は、高い基準を設けて、これらの大規模な実体インフラプロジェクトを追求し、上手に早く実施することが重要だと思います。税率の進展は私たちにとって非常に興奮することであり、私たちはできる限りの役割を果たすことを喜んでやります。
問:あなたは新しいAIの皇帝と話をしましたか?
ピチャイ:まだですが、デイビッド・サックスと会えるのを楽しみにしています。明らかに、これらの分野の技術専門家が入ってくるでしょう。私はそれが非常に非常に有益だと思います。私たちはその一部になるのを楽しみにしています。
問:具体的な詳細はまだないのですか?それがどのようなものであるかわからないのですか?
ピチャイ:はい。初期の兆候から、確かに大規模なイノベーションを推進することに関心があることが示されています。私たちはこれらの対話を楽しみにしています。
問:あなたの量子AIチームはエラー修正において大きな進展を遂げました。それを予見していましたか?あなたの反応は何ですか?
ピチャイ:私たちの量子チームが持っている非常に興奮することの一つは、ハルトムート・ネヴェンとチームが非常に厳格なフレームワークを持っており、彼らはこの明確なマイルストーンにおける進展を定義しています。私たちがマイルストーンを達成するたびに、私はこれらが野心的なプロジェクトであると感じます。これは間違いなく最もポジティブな驚きの一つです。このエラー修正の問題を解決しながら量子コンピュータで展開するという深いレベルの打破であることは間違いありません。これはこの分野で最も厳しい課題の一つです。私はこれに非常に満足しています。しかし、私たちにとっては、これは実用的な量子コンピュータの開発方法に焦点を当てたマイルストーンであり、新しい新規アプリケーションケースに応用できることが目標です。これは私たちのWaymoやAIの道のりに似ていて、両方とも時間を要します。しかし、決心すれば進展は避けられないと思います。
質問:量子は2010年のAIのようだと言いました。これは、量子がすぐに実際の影響を及ぼし始めることを意味します。大規模な量子コンピュータの実現は、アルファベットにとって何を意味しますか?
ピチャイ:あなたの前の質問について、クラシックコンピューティングやスパコンはますます強力になっています。しかし、特定のタイプのユースケースに対して、量子は最終的に強力な役割を果たすと思います。それは私たちの武器庫の中で重要なツールになるでしょう。未来において、量子とAIの交差は非常に刺激的です。私たちはGenCastと共に最先端の天気予報モデルを発表しました。しかし、未来に量子計算を利用できるとき、これらを予測する能力をより深く、より良いスケールで発揮することの重要性を過小評価してはいけません。これらはすべて深遠な実際的な意味を持っています。AlphaFoldが行ったようなことがあり、自然を理解し、自然をシミュレーションするために他に何ができるか、すべてが実用的な適用を持っています。そして、AIを通じても量子を通じても、私たちは宇宙における私たちの生活の性質と構造をより深く理解しています。これは宇宙が根本的に量子的であるため、私たちに最高のチャンスを与えていると思います。したがって、進展を遂げることはより深い影響を持ちます。それは世界を変えるだけでなく、多くの他のプロジェクトを支える可能性もあります。私の目標は、5年の枠内で量子を商業的に応用し、いくつかのユースケースを解決して、そこからさらに発展させることです。
質問:来年AI検索がより大きなものになるとおっしゃいました。AI Overview(AIの概要)は私の多くの検索に非常に役立つようになりました。もう少し詳しく説明していただけますか?
ピチャイ:私たちはAIオーバービュー検索の進展を非常に楽しみにしています。私はGemini 2.0 flashのAI概要を使用しており、その改善を実感しています。これはより多くの人々に普及させるものです。しかし、私たちはそれを使ってさらに多くのことを行います。私たちのAIモデルは検索を支援し、より複雑で深いクエリの体験を構築します。その際、クエリを分解し、ユーザーが反復してより深い答えを得るのを助ける必要があります。2025年には、確実にすぐに革新し、検索が2024年にはできなかったことを実現するでしょう。これが私がチームに設定した目標です:2025年の検索のある種の問題は2024年より明らかに改善されると考えています。これは刺激的で、知識と情報の最前線を推進していることを意味します。これらすべてがユーザーの手元に届くことを楽しみにしています。
質問:AIの安全性は多くの人が提起する別の質問です。デミスは、競争が激化する中で最大のリスクの一つは、安全作業からリソースを引き出すこと(安全性の弱化)が始まることだと言いました。これは本当ですか、それともセキュリティ作業に従事している人数や計算リソースの量について具体的にお話しいただけますか?これを測定する方法はありますか?
ピチャイ:私たちは常にこれが革新を促進する分野であると考えてきましたが、進歩を促進するためには最初から安全性を組み込むことが重要です。長期的に考え、長期投資する能力の利点の一つは、これらのモデルの基盤となる安全性にできる限り多くの投資を行っていることです。例えば、合成を構築し、オープンソースの側面を考慮することが、安全の境界を推進する方法です。これらのモデルをより代理的にすることで、私たちはすべて安全フレームワークに投資しています。しかし、私は安全性と革新が並行して進むと信じています。まさにこの点が私たちをWaymoでより大きな進展に導いてきました。最初の日から、安全性を私たちの革新と発展の実践に深く統合しており、それらは相互に補完し合っています。同様に、AIの分野でも、以前より多くの人がAIの安全性の仕事に従事し、より多くの計算リソースにアクセスできるようになっています。これは私たちが常に守るべきことです。
質問:反トラストに関する質問は興味深いです。私がChromeでMarinerをデモするとき、これが米国政府がGoogleに分割を強制しようとしている場所です。政府の任命を見れば、この状況が消えることはないようです。Chromeがなければ、Googleはどのような存在ですか?
ピチャイ:これは重要なプロセスであり、私たちは建設的に参加します。私たちが常に革新を追求して最良の製品を作っていることを法官が認識しているとは確信しています。救済措置の範囲は非常に広いと思います。私たちは強力な根拠を示す計画です。イノベーションの出現があなたの目に見えています。これらすべてが消費者に利益をもたらしなければなりません。根本的にこれが私たちの法律に基づいています。このアプローチを続け、ユーザーにとって有益なものを提供し続ける限り、最終的には成功すると思います。
質問:以前、地熱について話しました。それに関して何か興奮する事はありますか?何のタイプのエネルギーがこれを推進しますか?これは新しい風力発電の革新をもたらしますか?
ピチャイ:私たちは太陽光の可能性についてあまり知られていません。太陽光発電を拡大する機会はもっとあります。物理学や工学の観点から見ると、多くの選択肢があります。原子力エネルギーは既に証明されており、いくつかの国はこれを証明しました、そしてそれは今日でも有効です。私はより安全な選択肢が絶えず研究されていると思います。地球内部にも非常に多くのエネルギーがあります。私たちは地球の表面に住んでおり、地球の内部にも大量のエネルギーがあり、私たちはほとんど利用していません。決意を持てば、私たちはエネルギーの過剰に対処すべきだと思っています。エネルギーは触媒であるべきであり、制約であるべきではありません。私たちを前進させるのは、私たちの想像力と結果だけです。
質問:地熱の潜在的な場所の地図を見ています。それは大きく、米国西部全体をカバーしています。あなたたちはある(地熱でデータセンターに電力を供給します)が、それはまだ小さく、ギガワットではなく、メガワットです。深く掘る必要がありますか?
ピチャイ:エネルギーの需要は非常に大きいので、私たちはそれに応えることができると考えています。しかし、私たちはもっと多くの研究開発資金が必要です。本当にこれらの作業を開始するためには、より適切な許可が必要です。これが新しい政府が本当に機会を得る分野だと思います。彼らはすでに、これを達成することにコミットしていると表明しています。これは私たち全員が大きな進展を遂げることができることです。