share_log

被吐槽「没技术」的理想,要为自己正名

「技術がない」と批判された理想を正当化する必要がある。

Geekpark News ·  07/10 02:48

テスラのFSD(完全自動運転)が急速に中国市場に参入するにつれて、大手自動車会社もそれに続き、独自のエンドツーエンドの大規模モデルソリューションを発売しました。

六月、$LI AUTO-W (02015.HK)$会長兼CEOの李翔は、2024年の中国自動車重慶フォーラムで、理想の自社開発モデルとVLMビジュアルモデルに基づいたL3レベルの自動運転システムを発売するために、アイディアルオートが今年の第3四半期に、早くても今年末、遅くとも来年の初めまでに、NoA(自律支援ナビゲーションと運転)を開始すると述べました。同時に、このテクノロジーの進化、計算能力の向上、モデルの増加により、教師なしのL4レベルの自動運転は、少なくとも3年以内に確実に可能になるでしょう。

7月5日、アイディアルオートは理想の2024年スマートドライビング夏の記者会見を開催しました。Li Xiangはこの記者会見には出席しませんでした。代わりに、3人の技術専門家が理想的なインテリジェントドライビングの現在と未来を紹介しました。

記者会見では、最新のエンドツーエンド+VLMデュアルシステムインテリジェントドライビングモデルを対話形式で紹介しました。このシステムは、世界モデルの学習と思考環境を通じて、自動運転技術のイテレーションを加速させます。

同時に、IdealのOTA 6.0インテリジェント・ドライビング・アップグレードでは、高精細マップを必要としないNOA機能が導入され、理想的なMEGAモデルと理想的なL9、L8、L7、L6 AD Maxモデルが対象となり、24万人以上のユーザーにメリットをもたらし、全国的なインテリジェント・ドライビング・エクスペリエンスを実現します。

現在、多くのメーカーが「エンドツーエンド」を追いかけていますが、Ideal Autoは技術的なソリューションを開示した最初の自動車会社です。では、理想的な「エンドツーエンド」ソリューションの何がそんなに特別なのでしょうか?

テスラに「遅れずについていけ」

自動運転業界のベンチマーク企業として、テスラの技術ルートは常に大きな注目を集めてきました。2023年5月以来、イーロン・マスクは最初に「テスラFSD v12はエンドツーエンドのAIです」と公に述べました。2024年3月までに、テスラはv12バージョンの大規模なプロモーションを開始しました。テスラのエンドツーエンド技術の継続的な改善のプロセスは、中国の自動運転業界でも徐々に合意に達する過程を目の当たりにしてきました。

業界内のエンドツーエンドの開発動向については一般的なコンセンサスが得られていますが、特定の技術ルートにはまだ違いがあります。たとえば、「モジュール式エンドツーエンド」は教師あり学習のトレーニング方法を使用しますが、「シングルモデルのエンドツーエンド」は自己回帰的で生成的なトレーニング方法を好む場合があります。

理想的には、今回発表された自動運転計画は、Momentaのデュアルシステムモデルと少し似ています。理論的な情報源は、認知心理学におけるシステム1とシステム2の概念に言及しているノーベル賞受賞者の経済学者ダニエル・カーネマンの「思考、速い、遅い」理論です。その中で、システム1は人々の過去の経験や習慣に基づく直感であり、迅速に意思決定を行うことができます。システム2は考える能力と推論する能力を表しています。複雑な問題や未知のシナリオに直面すると、人々はそれらを解決するために考え、理由を考える必要があります。要するに、システム1とシステム2は連携して、人間の世界に対する認識と理解、意思決定の基礎を形成します。

具体的には、理想的な車の自動運転技術アーキテクチャは、主に3つの部分で実装されます。システム1は、主に従来の運転上の問題に迅速に対応するために使用されるエンドツーエンドモデル(E2E)によって実装されます。システムは3つの段階を経ました:

  • 認識、ポジショニング、プランニング、ナビゲーション、NPNを含むモジュラー設計は、100都市のNOAをサポートしています。

  • 画像なしモード。認識と計画には2つのモデルしかありません。最大の変化はNPNの廃止で、事前の情報に頼らなくなりました

  • テスラのワンモデルのエンドツーエンドモデルには1つのモデルしかありません。入力はセンサー、出力は走行軌跡です。

システム2は、複雑なシーンを処理できる視覚言語モデル(VLM)です。これは、プロンプトテキストを単語セグメンテーションごとにエンコードし、カメラの画像とナビゲーションマップ情報を一緒にモデルに送信して自己回帰推論を行うTransformerモデルで構成されています。システム2の出力には、環境理解、運転上の意思決定、運転経路などが含まれます。これらはシステム1に渡されて車両を制御します。

ほとんどのシングルフレームVLMモデルとは異なり、ストリーミングビデオエンコーダーは視覚情報を長期間キャッシュするように理想的に設計されています。さらに、履歴情報の複数のフレームをキャッシュできるメモリバンク(Memory Bank)がシステムに追加されました。これにより、シーケンス推論の遅延が長くなるという問題が解決されます。

このように理解すると、システム2はインテリジェントなナビゲーションと意思決定の専門家のようなものです。現在の道路状況や環境(カメラ画像)を確認できるだけでなく、地図情報やユーザーの指示(プロンプトテキスト)に基づいて意思決定や運転ルートの計画もできます。

同時に、Ideal Autoはエンドツーエンドのソリューションをテストして検証する方法を紹介しました。一般的に言えば、業界の主流は、3D仮想環境、再構築シミュレーション、およびシミュレーション生成を通じてシミュレーションテストを実施することです。理想的には、再構成シミュレーションとシミュレーション生成という2つの技術パスを組み合わせることです。

説明のために、例を挙げてみましょう。試験の準備をしていると仮定すると、練習しなければならない質問には、実際の質問と模擬問題の2種類があります。実際の問題は過去の試験で実際に出題された問題で、模擬問題は試験のシラバスに基づいて用意された新しい問題です。実際の質問は試験のスタイルや種類に慣れるのに役立ちますが、模擬問題は起こりうる新しい状況に対処するのに役立ちます。

理想的なテスト方法は、この準備プロセスに似ています。彼らは最初に3Dガウシアンスパッタリング(3DGS)技術を使って現実の問題であるかのように実際のシーンを再現し、次に生成されたモデルを使ってシミュレーションのような新しい視点を追加しました。このようにして、自動運転システムの性能をより包括的に評価できる、現実的で多様なテスト環境を構築しました。

さらに、動的と静的を分離する戦略を採用しました。これは、異なるタイプのトピックを別々に練習するようなものです。静的な部分は環境を再構築し、動的な部分は動的オブジェクトについて新しい視点を再構築して生成します。この方法により、天候の変化、時差、交通の流れなど、さまざまな運転条件をシミュレートできる360°編集可能な3D物理世界を作成し、自動運転システムの適応性を包括的にテストしました。

開城大仙をプレーし続けてください

新しい自動運転アーキテクチャに加えて、Ideal AutoはOTA 6.0スマートドライビングのアップグレードもリリースしました。これにより、高精細マップのサポートを必要としないNOA機能が導入されました。このアップグレードは、アイディアルMEGAモデルとアイディアルL9、L8、L7、L6 AdMaxモデルを対象とし、24万人以上のIdealユーザーにメリットをもたらします。

2023年、中国のスマートドライビング業界は「アーバン・ノア・ケソンバトル」に焦点を当てます。現在、ファーウェイとシャオペンは、高精細な地図を必要としない先進運転支援機能を導入しています。また、NIOはグローバルパイロットアシスタンスNOP+都市機能も導入しています。

今回は、理想がそれに続きました。情報によると、Ideal Autoが最近リリースしたマップされていないNOA(ナビゲーションアシスト運転)機能は、都市や町を走行するだけでなく、二次道路にも適応できます。以前のバージョンと比較して、新しいバージョンのタッチレスNOAは、BEV(航空写真)、検知能力、調整能力、および全体的なシステム機能が包括的に改善され、より複雑な運転環境にも対応できるようになりました。

記者会見で、Ideal AutoはWutu NOAの4つのコアコンピテンシーを解体しました。最初の2つが最も注目に値します。

  • どこでも開くことができます。絵に描けないNOAは、大量の「事前情報」に頼る必要はありません。理想的な車のインテリジェントな運転システムには、多くの「小さなロボット」が動作しています。一部の「小さなロボット」にはまだ事前情報が必要な場合がありますが、全体的な機能の向上により、システムは事前の検証なしに、さまざまな路面状況により柔軟に対応できます。

  • 迂回路はスムーズです。この機能は、時間と空間の二重計画を組み合わせたものです。実際に運転していると、交通を妨げている車や歩行者に遭遇することがよくあります。この時点で、「スムーズに迂回する」能力が特に重要です。その背後にある時空間関節能力は、水平と垂直(前、後、左、右)の空間を同時に計画し、自分の車と他の車両との空間的相互作用を継続的に予測することができます。「当面の間」考えられるすべての運転経路を計画することで、最良かつ最も効率的な運転経路が選択されます。

これに加えて、Ideal AutoはAEB(自動緊急ブレーキ)とAES(自動緊急ステアリング)にもいくつかの最適化を行いました。日常生活の低速シナリオ、特に地下駐車場などの複雑な環境では、柱や橋脚などの障害物に遭遇する可能性があります。理想的な車の低速AEBは、このような状況でも自動的に停止するので、傷がつかず、ユーザーのトラブルも軽減されます。

高速で運転しているときに、前の車が突然急ブレーキをかけて回避し、現在の車が前の車に近すぎて時間内に停止できない場合、理想的な車のAES機能が自動的に減速し、緊急回避のために操縦します。この機能は「フロントカーを紛失した」場合に特に重要で、運転の安全性を大幅に向上させることができます。

現在、エンドツーエンドの自動運転は業界のコンセンサスになっています。ファーウェイ、シャオペン、ユアンロン・チシン、シャンタン・ズイイン、01 AutoなどのOEMやインテリジェント・ドライビング・テクノロジー企業が相次いでこの分野に参入し、過去6か月以内に自動車の大量生産の計画が明らかになりました。

ただし、エンドツーエンドのテクノロジーは「万能」のテクノロジーではありません。実際に機能するには、完全なサポートシステムが必要です。テスラを例にとってみましょう。他の企業もエンドツーエンドのテクノロジーを使用していますが、結果はテスラほど良くありません。テスラの成功は、エンドツーエンドの採用だけでなく、細部に至るまで素晴らしい仕事をしてきたことによるものです。しかし、理想的な車はインテリジェントな運転という点では比較的遅れて導入されましたが、それでもエンドツーエンドで追いつく機会がありました。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする