share_log

海通证券:Gemini 2.0发布 带动谷歌进入“智能体时代”

海通証券:Gemini 2.0が発表され、Googleは「Asia Vets時代」に突入します

智通財経 ·  12/16 11:02

2025年初、谷歌はさらに多くのGoogle製品にGemini 2.0を拡張します。

智通财经APPの報道によれば、海通証券がリサーチレポートを発表し、Gemini 2.0は原生ユーザーインターフェースの操作能力、多模態推論、長文理解、複雑な指示の追従能力と計画能力、関数の呼び出し、原生ツールの使用、遅延最適化など一連の分野で最適化改良が行われたとしています。これにより、Gemini 2.0は応用能力の向上とAIエージェントの構築において、より顕著な利点を持つようになり、今後AIアプリケーションの実現やAIエージェントの発展も継続的に加速することが期待されます。

海通証券の主要な観点は以下の通りです。

Gemini 2.0がリリースされ、低遅延や多模態などの面で明らかな進歩を遂げました。

12月12日、谷歌はGemini 2.0シリーズモデルの最初のモデルであるGemini 2.0 Flashの体験版を発表しました。これは谷歌の主力モデルで、低遅延の特性を持っており、谷歌の大規模技術の最前線で卓越した性能を示しています。1.5 Flashと比較して、Gemini 2.0 Flashは同様の迅速な応答時間で性能がさらに強化されています。注目すべきは、2.0 Flashは主要なベンチマークテストで1.5 Proを超え、その速度は1.5 Proの2倍であるという点です。

同時に、2.0 Flashは新機能を持ち、画像、動画、音声などの多模態入力をサポートするだけでなく、直接画像とテキストが混ざったコンテンツを生成することや、原生的に制御可能な多言語テキストから音声への変換(TTS)音声を生成することもできるようになりました。また、Google Search、コード実行、第三者ユーザー定義関数などのツールも原生的に呼び出すことができます。2025年初頭には、谷歌はさらに多くのGoogle製品にGemini 2.0を拡張する予定です。

谷歌はAIエージェント分野に非常に注目しており、Gemini 2.0は重要な支援となっています。

AIの人工知能体は現実世界での応用が期待できる興味深い研究分野です。Gemini 2.0はGoogleが新しい人工知能体を構築できるようにし、Googleが汎用アシスタントを作るというビジョンに一歩近づけました。

プロジェクトアストラ:現実世界を多様な方法で理解する人工知能体。

プロジェクトアストラは、5月にGoogleによって発表された高度な視覚および対話応答人工知能体であり、未来のAIアシスタントを構築するために使用されます。Gemini 2.0に基づいて、プロジェクトアストラは多くの改善を実現しました:

より滑らかな対話:プロジェクトアストラは現在、複数の言語及び混合言語間で対話でき、さまざまなアクセントや難しい単語をよりよく理解できるようになりました。

新しいツールの使用:Gemini 2.0のおかげで、プロジェクトアストラはGoogle検索、Google Lens、Googleマップを使用でき、日常生活でアシスタントの役割をさらに良く果たします。

より強力な記憶力:Googleはプロジェクトアストラの記憶能力を向上させ、ユーザーが対話を管理できるようにしました。現在、最大で10分の会話内容を記憶でき、過去の対話を思い出すことができるため、ユーザーにより良いパーソナルサービスを提供します。

より低い遅延:新しいストリーミング技術とネイティブ音声理解能力のおかげで、この人工知能体は人間の対話に近い遅延で言語を理解できます。

プロジェクトマリナー:ユーザーが複雑なタスクを完了するのを助ける人工知能体。

Project Marinerは、Gemini 2.0を使用して構築された初期研究プロトタイプで、ユーザーのブラウザから始まり、人間と機械のインタラクションの未来を探索することを目的としています。研究プロトタイプとして、ブラウザページ内の情報を理解し、推論することができ、ピクセルやテキスト、コード、画像、フォームなどのウェブ要素を含み、実験的なChrome拡張機能を通じてこれらの情報を使用してユーザーがタスクを完了できるようにします。WebVoyagerベンチマークテスト(このテストは、エージェントのエンドツーエンドのリアルワールドウェブタスクにおける性能を評価します)において、Project Marinerは単一のエージェント設定として83.5%の作業効率を達成し、最先端のレベルに達しました。

Jules:開発者向けのエージェント。

次に、Googleは人工知能エージェントがJules(GitHubのワークフローに直接統合できる実験的なAIコードエージェント)を通じて開発者を支援する方法を探ります。それは問題を解決し、計画を立てて実行し、すべて開発者の指導と監視の下で行います。この作業は、すべての分野(コーディングを含む)で支援を提供するAIエージェントを構築するというGoogleの長期目標の一部です。

ゲームやその他の分野のエージェント。

GoogleはGemini 2.0を使用してエージェントを構築し、ユーザーがビデオゲームでより賢明な決定を下せるように支援します。スクリーン上のリアルタイムの映像に基づいてゲームの状況を分析し、ユーザーに次の行動の提案を行います。GoogleはSupercellなどの主要なゲーム開発チームと協力して、ゲーム分野におけるエージェントの応用を探求しています。Googleは、さまざまなゲームでのパフォーマンスをテストすることで、エージェントがゲームのルールを理解し、チャレンジに対処する能力を評価しています。これらのエージェントは、Google検索を通じてユーザーが豊富なゲーム関連の知識にアクセスできるようにします。Googleはまた、Gemini 2.0の空間推論能力をロボット分野に応用し、エージェントが現実世界で支援を提供できるように試みています。

リスク警告:AI技術の進展が予想に達しない場合、AIアプリケーションの展開が期待外れになる可能性があります。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする