「技術がない」と批判された理想を正当化する必要がある。

随着特斯拉FSD（完全自动驾驶）进入中国市场的步伐加快，各大车企纷纷跟进，推出自己的端到端大模型方案。

6月，$理想汽车-W (02015.HK)$董事长兼CEO李想在2024中国汽车重庆论坛上表示，理想汽车将在今年三季度推出无图NOA（自动辅助导航驾驶），最早今年年底最晚明年年初，推出基于理想自研大模型和VLM视觉模型的L3级自动驾驶系统。同时，随着这套技术的演进、算力的增强、模型的加大，无监督的L4级别自动驾驶至少三年内一定可以实现。

7月5日，理想汽车举办了理想 2024 智能驾驶夏季发布会。这次发布会李想并没有出席，而是由三位技术专家介绍了理想智能驾驶的现在和未来。

在发布会上，他们以对话的形式，介绍了最新的端到端+VLM双系统智能驾驶模型，通过世界模型的学习和思考环境，这一系统将加速自动驾驶技术的迭代。

同时，理想推出的OTA 6.0版本智能驾驶升级，将引入无需高清地图的NOA功能，并覆盖理想MEGA和理想L9、L8、L7、L6的AD Max车型，惠及超过24万名用户，实现全国范围内的智能驾驶体验。

目前，多家厂商都在追逐「端到端」，但理想汽车是首个公开技术方案的车企。那么，理想的「端到端」方案到底有何特殊之处呢？

「紧跟」特斯拉

作为自动驾驶行业的标杆企业，特斯拉的技术路线一直备受关注。自2023年5月，伊隆·马斯克首次公开提到「特斯拉FSD v12是一个端到端AI」，到2024年3月，特斯拉开始大规模推送v12版本，特斯拉的端到端技术不断进步的过程，也见证了中国自动驾驶行业逐渐达成共识的历程。

尽管行业内对端到端的发展趋势已形成普遍共识，但在具体技术路线上的分歧仍然存在。例如，「模块化端到端」采用监督学习的训练方式，而「单模型端到端」可能更倾向于自回归和生成式的训练方法。

理想这次公布的自动驾驶方案，有点类似Momenta的双系统模式。其理论来源是诺贝尔经济学奖得主丹尼尔·卡尼曼的《思考，快与慢》理论，提到了认知心理学里系统 1 与系统 2 的概念。其中，系统 1 是基于人们过去的经验和习惯形成的直觉，能够迅速做出决策。系统 2 则代表着思维推理的能力，面对复杂问题和未知场景，人们需要思考、推理来解决。总之，系统 1 和系统 2 相互协作，构成了人类认知和理解世界以及做出决策的基石。

具体到理想汽车的自动驾驶技术架构，主要靠三个部分来实现：系统 1 由端到端模型（E2E）实现，主要用于快速响应常规驾驶问题。这个系统经历了三个阶段：

模块化设计，包含感知、定位、规划、导航、NPN，支持了 100 个城市的 NOA。
无图模式。只有感知和规划两个模型，最大的变化是去掉了NPN，不依赖于先验信息
类似特斯拉的 One Model的端到端模型，只有一个模型，输入的是传感器，输出的是行驶轨迹。

系统2是视觉语言模型（VLM），具备处理复杂场景的能力。它由Transformer模型组成，将提示词（Prompt）文本进行分词编码，并将摄像头图像和导航地图信息一起传输给模型进行自回归推理。系统2的输出包括环境理解、驾驶决策和驾驶轨迹，然后传递给系统1来控制车辆。

与大多数单帧的VLM模型不同，理想设计了流式视频编码器，能够缓存更长时间的视觉信息。此外，系统还增加了记忆模块（Memory bank），可以缓存多帧历史信息，从而解决长时间序列推理时延的问题。

可以这样理解，系统2就像是一位智能导航和决策专家，它不仅能够看到当前的路况和环境（摄像头图像），还能够根据地图信息和用户的指令（Prompt文本）来进行决策和规划行车路径。

与此同时，理想汽车介绍了端到端方案的测试和验证方法。一般来说，业内主流的做法是通过3D虚拟环境、重建仿真、生成仿真等进行仿真测试。理想则结合了重建仿真和生成仿真两种技术路径。

可以用一个比方来说明：假设你在准备考试，有两种题型需要练习：真题和模拟题。真题是过去考试中实际出现过的问题，模拟题则是根据考试大纲编写的新题目。真题可以让你熟悉考试的风格和类型，而模拟题可以帮助你应对可能出现的新情况。

理想的测试方法类似于这个准备过程。他们先使用3D高斯溅射（3DGS）技术，像是真题一样重建真实场景，然后利用生成模型，像是模拟题一样补充新的视角。这样一来，他们创建的测试环境既真实又多样，可以更全面地评估自动驾驶系统的表现。

此外，他们采用了动静态分离的策略，就像是分开练习不同类型的题目：静态部分是环境重建，动态部分则是对动态物体进行重建和生成新视角。通过这种方法，他们创建了一个360°可编辑的3D物理世界，能够模拟各种不同的驾驶条件，比如天气变化、时间不同、车流量等，来全面测试自动驾驶系统的适应能力。

开城大战继续玩下去

除了自动驾驶新架构，理想汽车还发布OTA 6.0版本的智能驾驶升级，带来无需高清地图支持的NOA功能。这次升级将覆盖理想MEGA以及理想L9、L8、L7、L6的ADMax车型，惠及理想超过24万名用户。

在2023年，中国智能驾驶行业的焦点集中在「城市NOA开城大战」。目前，华为和小鹏已经推出了无需高清地图的高阶驾驶辅助功能，蔚来也推出了全域领航辅助NOP+城区功能。

这次，理想也紧随其后。据了解，理想汽车最新发布的无图NOA（导航辅助驾驶）功能不仅可以在城市和城镇中行驶，还能适应二级道路。相比之前的版本，新版无图NOA在BEV（鸟瞰视图）、感知能力、规控能力以及整体系统能力上都有了全面提升，能够应对更多复杂的行驶环境。

发布会上，理想汽车拆解了无图NOA的四大核心能力，其中最值得关注的是前两个：

哪里都能开。无图NOA无需依赖大量的「先验信息」。理想汽车的智能驾驶系统中有许多「小机器人」在运行，虽然部分「小机器人」可能仍需一些先验信息，但整体能力的提升，使得系统能够更灵活地应对各种路面情况，而无需事先验证。
绕行丝滑。该能力结合了时间和空间的双重规划。在实际驾驶中，常常会遇到车辆或行人阻碍通行。这时，「绕行顺畅」能力就显得尤为重要。其背后的时空联合能力，可以同步规划横纵（前后左右）的空间，并持续预测自车与他车之间的空间交互关系。通过规划出「未来一段时间内」的所有可行驶轨迹，筛选出最优、最高效的行驶路径。

除此之外，理想汽车还对AEB（自动紧急制动）和AES（自动紧急转向）进行了多项优化。在日常生活中的低速场景，特别是在地库停车等复杂环境中，用户可能会遇到柱子、墩子等障碍物。理想汽车的低速AEB能够在这些情况下自动刹停，避免剐蹭，减少用户的烦恼。

在高速行驶时，如果前车突然急刹并避让，而当前的车与前车距离过近，无法及时刹停，理想汽车的AES功能会自动减速并紧急转向避让。这个功能在“消失的前车”场景中尤其重要，可以显著提升行车安全。

目前，端到端自动驾驶已经成为行业的共识。华为、小鹏、元戎启行、商汤绝影、零一汽车等主机厂和智能驾驶技术公司纷纷进入这一领域，并在最近半年陆续披露了上车量产规划。

然而，端到端技术不是一项「一招鲜」的技术，它需要一整套支持系统才能真正发挥作用。以特斯拉为例，虽然其他公司也在使用端到端技术，但效果却不如特斯拉理想。特斯拉的成功不仅是因为采用了端到端，还因为他们在每个细节上都做得非常出色。不过，对在智能驾驶上的布局虽然相对较晚的理想汽车，端到端还是让它有了追赶的机会。

テスラのFSD（完全自動運転）が急速に中国市場に参入するにつれて、大手自動車会社もそれに続き、独自のエンドツーエンドの大規模モデルソリューションを発売しました。

六月、$LI AUTO-W (02015.HK)$会長兼CEOの李翔は、2024年の中国自動車重慶フォーラムで、理想の自社開発モデルとVLMビジュアルモデルに基づいたL3レベルの自動運転システムを発売するために、アイディアルオートが今年の第3四半期に、早くても今年末、遅くとも来年の初めまでに、NoA（自律支援ナビゲーションと運転）を開始すると述べました。同時に、このテクノロジーの進化、計算能力の向上、モデルの増加により、教師なしのL4レベルの自動運転は、少なくとも3年以内に確実に可能になるでしょう。

7月5日、アイディアルオートは理想の2024年スマートドライビング夏の記者会見を開催しました。Li Xiangはこの記者会見には出席しませんでした。代わりに、3人の技術専門家が理想的なインテリジェントドライビングの現在と未来を紹介しました。

記者会見では、最新のエンドツーエンド+VLMデュアルシステムインテリジェントドライビングモデルを対話形式で紹介しました。このシステムは、世界モデルの学習と思考環境を通じて、自動運転技術のイテレーションを加速させます。

同時に、IdealのOTA 6.0インテリジェント・ドライビング・アップグレードでは、高精細マップを必要としないNOA機能が導入され、理想的なMEGAモデルと理想的なL9、L8、L7、L6 AD Maxモデルが対象となり、24万人以上のユーザーにメリットをもたらし、全国的なインテリジェント・ドライビング・エクスペリエンスを実現します。

現在、多くのメーカーが「エンドツーエンド」を追いかけていますが、Ideal Autoは技術的なソリューションを開示した最初の自動車会社です。では、理想的な「エンドツーエンド」ソリューションの何がそんなに特別なのでしょうか？

テスラに「遅れずについていけ」

自動運転業界のベンチマーク企業として、テスラの技術ルートは常に大きな注目を集めてきました。2023年5月以来、イーロン・マスクは最初に「テスラFSD v12はエンドツーエンドのAIです」と公に述べました。2024年3月までに、テスラはv12バージョンの大規模なプロモーションを開始しました。テスラのエンドツーエンド技術の継続的な改善のプロセスは、中国の自動運転業界でも徐々に合意に達する過程を目の当たりにしてきました。

業界内のエンドツーエンドの開発動向については一般的なコンセンサスが得られていますが、特定の技術ルートにはまだ違いがあります。たとえば、「モジュール式エンドツーエンド」は教師あり学習のトレーニング方法を使用しますが、「シングルモデルのエンドツーエンド」は自己回帰的で生成的なトレーニング方法を好む場合があります。

理想的には、今回発表された自動運転計画は、Momentaのデュアルシステムモデルと少し似ています。理論的な情報源は、認知心理学におけるシステム1とシステム2の概念に言及しているノーベル賞受賞者の経済学者ダニエル・カーネマンの「思考、速い、遅い」理論です。その中で、システム1は人々の過去の経験や習慣に基づく直感であり、迅速に意思決定を行うことができます。システム2は考える能力と推論する能力を表しています。複雑な問題や未知のシナリオに直面すると、人々はそれらを解決するために考え、理由を考える必要があります。要するに、システム1とシステム2は連携して、人間の世界に対する認識と理解、意思決定の基礎を形成します。

具体的には、理想的な車の自動運転技術アーキテクチャは、主に3つの部分で実装されます。システム1は、主に従来の運転上の問題に迅速に対応するために使用されるエンドツーエンドモデル（E2E）によって実装されます。システムは3つの段階を経ました：

認識、ポジショニング、プランニング、ナビゲーション、NPNを含むモジュラー設計は、100都市のNOAをサポートしています。
画像なしモード。認識と計画には2つのモデルしかありません。最大の変化はNPNの廃止で、事前の情報に頼らなくなりました
テスラのワンモデルのエンドツーエンドモデルには1つのモデルしかありません。入力はセンサー、出力は走行軌跡です。

システム2は、複雑なシーンを処理できる視覚言語モデル（VLM）です。これは、プロンプトテキストを単語セグメンテーションごとにエンコードし、カメラの画像とナビゲーションマップ情報を一緒にモデルに送信して自己回帰推論を行うTransformerモデルで構成されています。システム2の出力には、環境理解、運転上の意思決定、運転経路などが含まれます。これらはシステム1に渡されて車両を制御します。

ほとんどのシングルフレームVLMモデルとは異なり、ストリーミングビデオエンコーダーは視覚情報を長期間キャッシュするように理想的に設計されています。さらに、履歴情報の複数のフレームをキャッシュできるメモリバンク（Memory Bank）がシステムに追加されました。これにより、シーケンス推論の遅延が長くなるという問題が解決されます。

このように理解すると、システム2はインテリジェントなナビゲーションと意思決定の専門家のようなものです。現在の道路状況や環境（カメラ画像）を確認できるだけでなく、地図情報やユーザーの指示（プロンプトテキスト）に基づいて意思決定や運転ルートの計画もできます。

同時に、Ideal Autoはエンドツーエンドのソリューションをテストして検証する方法を紹介しました。一般的に言えば、業界の主流は、3D仮想環境、再構築シミュレーション、およびシミュレーション生成を通じてシミュレーションテストを実施することです。理想的には、再構成シミュレーションとシミュレーション生成という2つの技術パスを組み合わせることです。

説明のために、例を挙げてみましょう。試験の準備をしていると仮定すると、練習しなければならない質問には、実際の質問と模擬問題の2種類があります。実際の問題は過去の試験で実際に出題された問題で、模擬問題は試験のシラバスに基づいて用意された新しい問題です。実際の質問は試験のスタイルや種類に慣れるのに役立ちますが、模擬問題は起こりうる新しい状況に対処するのに役立ちます。

理想的なテスト方法は、この準備プロセスに似ています。彼らは最初に3Dガウシアンスパッタリング（3DGS）技術を使って現実の問題であるかのように実際のシーンを再現し、次に生成されたモデルを使ってシミュレーションのような新しい視点を追加しました。このようにして、自動運転システムの性能をより包括的に評価できる、現実的で多様なテスト環境を構築しました。

さらに、動的と静的を分離する戦略を採用しました。これは、異なるタイプのトピックを別々に練習するようなものです。静的な部分は環境を再構築し、動的な部分は動的オブジェクトについて新しい視点を再構築して生成します。この方法により、天候の変化、時差、交通の流れなど、さまざまな運転条件をシミュレートできる360°編集可能な3D物理世界を作成し、自動運転システムの適応性を包括的にテストしました。

開城大仙をプレーし続けてください

新しい自動運転アーキテクチャに加えて、Ideal AutoはOTA 6.0スマートドライビングのアップグレードもリリースしました。これにより、高精細マップのサポートを必要としないNOA機能が導入されました。このアップグレードは、アイディアルMEGAモデルとアイディアルL9、L8、L7、L6 AdMaxモデルを対象とし、24万人以上のIdealユーザーにメリットをもたらします。

2023年、中国のスマートドライビング業界は「アーバン・ノア・ケソンバトル」に焦点を当てます。現在、ファーウェイとシャオペンは、高精細な地図を必要としない先進運転支援機能を導入しています。また、NIOはグローバルパイロットアシスタンスNOP+都市機能も導入しています。

今回は、理想がそれに続きました。情報によると、Ideal Autoが最近リリースしたマップされていないNOA（ナビゲーションアシスト運転）機能は、都市や町を走行するだけでなく、二次道路にも適応できます。以前のバージョンと比較して、新しいバージョンのタッチレスNOAは、BEV（航空写真）、検知能力、調整能力、および全体的なシステム機能が包括的に改善され、より複雑な運転環境にも対応できるようになりました。

記者会見で、Ideal AutoはWutu NOAの4つのコアコンピテンシーを解体しました。最初の2つが最も注目に値します。

どこでも開くことができます。絵に描けないNOAは、大量の「事前情報」に頼る必要はありません。理想的な車のインテリジェントな運転システムには、多くの「小さなロボット」が動作しています。一部の「小さなロボット」にはまだ事前情報が必要な場合がありますが、全体的な機能の向上により、システムは事前の検証なしに、さまざまな路面状況により柔軟に対応できます。
迂回路はスムーズです。この機能は、時間と空間の二重計画を組み合わせたものです。実際に運転していると、交通を妨げている車や歩行者に遭遇することがよくあります。この時点で、「スムーズに迂回する」能力が特に重要です。その背後にある時空間関節能力は、水平と垂直（前、後、左、右）の空間を同時に計画し、自分の車と他の車両との空間的相互作用を継続的に予測することができます。「当面の間」考えられるすべての運転経路を計画することで、最良かつ最も効率的な運転経路が選択されます。

これに加えて、Ideal AutoはAEB（自動緊急ブレーキ）とAES（自動緊急ステアリング）にもいくつかの最適化を行いました。日常生活の低速シナリオ、特に地下駐車場などの複雑な環境では、柱や橋脚などの障害物に遭遇する可能性があります。理想的な車の低速AEBは、このような状況でも自動的に停止するので、傷がつかず、ユーザーのトラブルも軽減されます。

高速で運転しているときに、前の車が突然急ブレーキをかけて回避し、現在の車が前の車に近すぎて時間内に停止できない場合、理想的な車のAES機能が自動的に減速し、緊急回避のために操縦します。この機能は「フロントカーを紛失した」場合に特に重要で、運転の安全性を大幅に向上させることができます。

現在、エンドツーエンドの自動運転は業界のコンセンサスになっています。ファーウェイ、シャオペン、ユアンロン・チシン、シャンタン・ズイイン、01 AutoなどのOEMやインテリジェント・ドライビング・テクノロジー企業が相次いでこの分野に参入し、過去6か月以内に自動車の大量生産の計画が明らかになりました。

ただし、エンドツーエンドのテクノロジーは「万能」のテクノロジーではありません。実際に機能するには、完全なサポートシステムが必要です。テスラを例にとってみましょう。他の企業もエンドツーエンドのテクノロジーを使用していますが、結果はテスラほど良くありません。テスラの成功は、エンドツーエンドの採用だけでなく、細部に至るまで素晴らしい仕事をしてきたことによるものです。しかし、理想的な車はインテリジェントな運転という点では比較的遅れて導入されましたが、それでもエンドツーエンドで追いつく機会がありました。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。更に詳しい情報

被吐槽「没技术」的理想，要为自己正名

「技術がない」と批判された理想を正当化する必要がある。

「紧跟」特斯拉

开城大战继续玩下去

テスラに「遅れずについていけ」

開城大仙をプレーし続けてください

リスク免責事項

ご利用明細