被吐槽「沒技術」的理想，要爲自己正名

極客公園 · 07/10 02:48

随着特斯拉FSD（完全自动驾驶）进入中国市场的步伐加快，各大车企纷纷跟进，推出自己的端到端大模型方案。

6月，$理想汽车-W (02015.HK)$董事长兼CEO李想在2024中国汽车重庆论坛上表示，理想汽车将在今年三季度推出无图NOA（自动辅助导航驾驶），最早今年年底最晚明年年初，推出基于理想自研大模型和VLM视觉模型的L3级自动驾驶系统。同时，随着这套技术的演进、算力的增强、模型的加大，无监督的L4级别自动驾驶至少三年内一定可以实现。

7月5日，理想汽车举办了理想 2024 智能驾驶夏季发布会。这次发布会李想并没有出席，而是由三位技术专家介绍了理想智能驾驶的现在和未来。

在发布会上，他们以对话的形式，介绍了最新的端到端+VLM双系统智能驾驶模型，通过世界模型的学习和思考环境，这一系统将加速自动驾驶技术的迭代。

同时，理想推出的OTA 6.0版本智能驾驶升级，将引入无需高清地图的NOA功能，并覆盖理想MEGA和理想L9、L8、L7、L6的AD Max车型，惠及超过24万名用户，实现全国范围内的智能驾驶体验。

目前，多家厂商都在追逐「端到端」，但理想汽车是首个公开技术方案的车企。那么，理想的「端到端」方案到底有何特殊之处呢？

「紧跟」特斯拉

作为自动驾驶行业的标杆企业，特斯拉的技术路线一直备受关注。自2023年5月，伊隆·马斯克首次公开提到「特斯拉FSD v12是一个端到端AI」，到2024年3月，特斯拉开始大规模推送v12版本，特斯拉的端到端技术不断进步的过程，也见证了中国自动驾驶行业逐渐达成共识的历程。

尽管行业内对端到端的发展趋势已形成普遍共识，但在具体技术路线上的分歧仍然存在。例如，「模块化端到端」采用监督学习的训练方式，而「单模型端到端」可能更倾向于自回归和生成式的训练方法。

理想这次公布的自动驾驶方案，有点类似Momenta的双系统模式。其理论来源是诺贝尔经济学奖得主丹尼尔·卡尼曼的《思考，快与慢》理论，提到了认知心理学里系统 1 与系统 2 的概念。其中，系统 1 是基于人们过去的经验和习惯形成的直觉，能够迅速做出决策。系统 2 则代表着思维推理的能力，面对复杂问题和未知场景，人们需要思考、推理来解决。总之，系统 1 和系统 2 相互协作，构成了人类认知和理解世界以及做出决策的基石。

具体到理想汽车的自动驾驶技术架构，主要靠三个部分来实现：系统 1 由端到端模型（E2E）实现，主要用于快速响应常规驾驶问题。这个系统经历了三个阶段：

模块化设计，包含感知、定位、规划、导航、NPN，支持了 100 个城市的 NOA。
无图模式。只有感知和规划两个模型，最大的变化是去掉了NPN，不依赖于先验信息
类似特斯拉的 One Model的端到端模型，只有一个模型，输入的是传感器，输出的是行驶轨迹。

系统2是视觉语言模型（VLM），具备处理复杂场景的能力。它由Transformer模型组成，将提示词（Prompt）文本进行分词编码，并将摄像头图像和导航地图信息一起传输给模型进行自回归推理。系统2的输出包括环境理解、驾驶决策和驾驶轨迹，然后传递给系统1来控制车辆。

与大多数单帧的VLM模型不同，理想设计了流式视频编码器，能够缓存更长时间的视觉信息。此外，系统还增加了记忆模块（Memory bank），可以缓存多帧历史信息，从而解决长时间序列推理时延的问题。

可以这样理解，系统2就像是一位智能导航和决策专家，它不仅能够看到当前的路况和环境（摄像头图像），还能够根据地图信息和用户的指令（Prompt文本）来进行决策和规划行车路径。

与此同时，理想汽车介绍了端到端方案的测试和验证方法。一般来说，业内主流的做法是通过3D虚拟环境、重建仿真、生成仿真等进行仿真测试。理想则结合了重建仿真和生成仿真两种技术路径。

可以用一个比方来说明：假设你在准备考试，有两种题型需要练习：真题和模拟题。真题是过去考试中实际出现过的问题，模拟题则是根据考试大纲编写的新题目。真题可以让你熟悉考试的风格和类型，而模拟题可以帮助你应对可能出现的新情况。

理想的测试方法类似于这个准备过程。他们先使用3D高斯溅射（3DGS）技术，像是真题一样重建真实场景，然后利用生成模型，像是模拟题一样补充新的视角。这样一来，他们创建的测试环境既真实又多样，可以更全面地评估自动驾驶系统的表现。

此外，他们采用了动静态分离的策略，就像是分开练习不同类型的题目：静态部分是环境重建，动态部分则是对动态物体进行重建和生成新视角。通过这种方法，他们创建了一个360°可编辑的3D物理世界，能够模拟各种不同的驾驶条件，比如天气变化、时间不同、车流量等，来全面测试自动驾驶系统的适应能力。

开城大战继续玩下去

除了自动驾驶新架构，理想汽车还发布OTA 6.0版本的智能驾驶升级，带来无需高清地图支持的NOA功能。这次升级将覆盖理想MEGA以及理想L9、L8、L7、L6的ADMax车型，惠及理想超过24万名用户。

在2023年，中国智能驾驶行业的焦点集中在「城市NOA开城大战」。目前，华为和小鹏已经推出了无需高清地图的高阶驾驶辅助功能，蔚来也推出了全域领航辅助NOP+城区功能。

这次，理想也紧随其后。据了解，理想汽车最新发布的无图NOA（导航辅助驾驶）功能不仅可以在城市和城镇中行驶，还能适应二级道路。相比之前的版本，新版无图NOA在BEV（鸟瞰视图）、感知能力、规控能力以及整体系统能力上都有了全面提升，能够应对更多复杂的行驶环境。

发布会上，理想汽车拆解了无图NOA的四大核心能力，其中最值得关注的是前两个：

哪里都能开。无图NOA无需依赖大量的「先验信息」。理想汽车的智能驾驶系统中有许多「小机器人」在运行，虽然部分「小机器人」可能仍需一些先验信息，但整体能力的提升，使得系统能够更灵活地应对各种路面情况，而无需事先验证。
绕行丝滑。该能力结合了时间和空间的双重规划。在实际驾驶中，常常会遇到车辆或行人阻碍通行。这时，「绕行顺畅」能力就显得尤为重要。其背后的时空联合能力，可以同步规划横纵（前后左右）的空间，并持续预测自车与他车之间的空间交互关系。通过规划出「未来一段时间内」的所有可行驶轨迹，筛选出最优、最高效的行驶路径。

除此之外，理想汽车还对AEB（自动紧急制动）和AES（自动紧急转向）进行了多项优化。在日常生活中的低速场景，特别是在地库停车等复杂环境中，用户可能会遇到柱子、墩子等障碍物。理想汽车的低速AEB能够在这些情况下自动刹停，避免剐蹭，减少用户的烦恼。

在高速行驶时，如果前车突然急刹并避让，而当前的车与前车距离过近，无法及时刹停，理想汽车的AES功能会自动减速并紧急转向避让。这个功能在“消失的前车”场景中尤其重要，可以显著提升行车安全。

目前，端到端自动驾驶已经成为行业的共识。华为、小鹏、元戎启行、商汤绝影、零一汽车等主机厂和智能驾驶技术公司纷纷进入这一领域，并在最近半年陆续披露了上车量产规划。

然而，端到端技术不是一项「一招鲜」的技术，它需要一整套支持系统才能真正发挥作用。以特斯拉为例，虽然其他公司也在使用端到端技术，但效果却不如特斯拉理想。特斯拉的成功不仅是因为采用了端到端，还因为他们在每个细节上都做得非常出色。不过，对在智能驾驶上的布局虽然相对较晚的理想汽车，端到端还是让它有了追赶的机会。

隨着特斯拉FSD（完全自動駕駛）進入中國市場的步伐加快，各大車企紛紛跟進，推出自己的端到端大模型方案。

6月，$理想汽車-W (02015.HK)$董事長兼CEO李想在2024中國汽車重慶論壇上表示，理想汽車將在今年三季度推出無圖NOA（自動輔助導航駕駛），最早今年年底最晚明年年初，推出基於理想自研大模型和VLM視覺模型的L3級自動駕駛系統。同時，隨着這套技術的演進、算力的增強、模型的加大，無監督的L4級別自動駕駛至少三年內一定可以實現。

7月5日，理想汽車舉辦了理想 2024 智能駕駛夏季發佈會。這次發佈會李想並沒有出席，而是由三位技術專家介紹了理想智能駕駛的現在和未來。

在發佈會上，他們以對話的形式，介紹了最新的端到端+VLM雙系統智能駕駛模型，通過世界模型的學習和思考環境，這一系統將加速自動駕駛技術的迭代。

同時，理想推出的OTA 6.0版本智能駕駛升級，將引入無需高清地圖的NOA功能，並覆蓋理想MEGA和理想L9、L8、L7、L6的AD Max車型，惠及超過24萬名用戶，實現全國範圍內的智能駕駛體驗。

目前，多家廠商都在追逐「端到端」，但理想汽車是首個公開技術方案的車企。那麼，理想的「端到端」方案到底有何特殊之處呢？

「緊跟」特斯拉

作爲自動駕駛行業的標杆企業，特斯拉的技術路線一直備受關注。自2023年5月，伊隆·馬斯克首次公開提到「特斯拉FSD v12是一個端到端AI」，到2024年3月，特斯拉開始大規模推送v12版本，特斯拉的端到端技術不斷進步的過程，也見證了中國自動駕駛行業逐漸達成共識的歷程。

儘管行業內對端到端的發展趨勢已形成普遍共識，但在具體技術路線上的分歧仍然存在。例如，「模塊化端到端」採用監督學習的訓練方式，而「單模型端到端」可能更傾向於自回歸和生成式的訓練方法。

理想這次公佈的自動駕駛方案，有點類似Momenta的雙系統模式。其理論來源是諾貝爾經濟學獎得主丹尼爾·卡尼曼的《思考，快與慢》理論，提到了認知心理學裏系統 1 與系統 2 的概念。其中，系統 1 是基於人們過去的經驗和習慣形成的直覺，能夠迅速做出決策。系統 2 則代表着思維推理的能力，面對複雜問題和未知場景，人們需要思考、推理來解決。總之，系統 1 和系統 2 相互協作，構成了人類認知和理解世界以及做出決策的基石。

具體到理想汽車的自動駕駛技術架構，主要靠三個部分來實現：系統 1 由端到端模型（E2E）實現，主要用於快速響應常規駕駛問題。這個系統經歷了三個階段：

模塊化設計，包含感知、定位、規劃、導航、NPN，支持了 100 個城市的 NOA。
無圖模式。只有感知和規劃兩個模型，最大的變化是去掉了NPN，不依賴於先驗信息
類似特斯拉的 One Model的端到端模型，只有一個模型，輸入的是傳感器，輸出的是行駛軌跡。

系統2是視覺語言模型（VLM），具備處理複雜場景的能力。它由Transformer模型組成，將提示詞（Prompt）文本進行分詞編碼，並將攝像頭圖像和導航地圖信息一起傳輸給模型進行自回歸推理。系統2的輸出包括環境理解、駕駛決策和駕駛軌跡，然後傳遞給系統1來控制車輛。

與大多數單幀的VLM模型不同，理想設計了流式視頻編碼器，能夠緩存更長時間的視覺信息。此外，系統還增加了記憶模塊（Memory bank），可以緩存多幀歷史信息，從而解決長時間序列推理時延的問題。

可以這樣理解，系統2就像是一位智能導航和決策專家，它不僅能夠看到當前的路況和環境（攝像頭圖像），還能夠根據地圖信息和用戶的指令（Prompt文本）來進行決策和規劃行車路徑。

與此同時，理想汽車介紹了端到端方案的測試和驗證方法。一般來說，業內主流的做法是通過3D虛擬環境、重建仿真、生成仿真等進行仿真測試。理想則結合了重建仿真和生成仿真兩種技術路徑。

可以用一個比方來說明：假設你在準備考試，有兩種題型需要練習：真題和模擬題。真題是過去考試中實際出現過的問題，模擬題則是根據考試大綱編寫的新題目。真題可以讓你熟悉考試的風格和類型，而模擬題可以幫助你應對可能出現的新情況。

理想的測試方法類似於這個準備過程。他們先使用3D高斯濺射（3DGS）技術，像是真題一樣重建真實場景，然後利用生成模型，像是模擬題一樣補充新的視角。這樣一來，他們創建的測試環境既真實又多樣，可以更全面地評估自動駕駛系統的表現。

此外，他們採用了動靜態分離的策略，就像是分開練習不同類型的題目：靜態部分是環境重建，動態部分則是對動態物體進行重建和生成新視角。通過這種方法，他們創建了一個360°可編輯的3D物理世界，能夠模擬各種不同的駕駛條件，比如天氣變化、時間不同、車流量等，來全面測試自動駕駛系統的適應能力。

開城大戰繼續玩下去

除了自動駕駛新架構，理想汽車還發布OTA 6.0版本的智能駕駛升級，帶來無需高清地圖支持的NOA功能。這次升級將覆蓋理想MEGA以及理想L9、L8、L7、L6的ADMax車型，惠及理想超過24萬名用戶。

在2023年，中國智能駕駛行業的焦點集中在「城市NOA開城大戰」。目前，華爲和小鵬已經推出了無需高清地圖的高階駕駛輔助功能，蔚來也推出了全域領航輔助NOP+城區功能。

這次，理想也緊隨其後。據了解，理想汽車最新發布的無圖NOA（導航輔助駕駛）功能不僅可以在城市和城鎮中行駛，還能適應二級道路。相比之前的版本，新版無圖NOA在BEV（鳥瞰視圖）、感知能力、規控能力以及整體系統能力上都有了全面提升，能夠應對更多複雜的行駛環境。

發佈會上，理想汽車拆解了無圖NOA的四大核心能力，其中最值得關注的是前兩個：

哪裏都能開。無圖NOA無需依賴大量的「先驗信息」。理想汽車的智能駕駛系統中有許多「小機器人」在運行，雖然部分「小機器人」可能仍需一些先驗信息，但整體能力的提升，使得系統能夠更靈活地應對各種路面情況，而無需事先驗證。
繞行絲滑。該能力結合了時間和空間的雙重規劃。在實際駕駛中，常常會遇到車輛或行人阻礙通行。這時，「繞行順暢」能力就顯得尤爲重要。其背後的時空聯合能力，可以同步規劃橫縱（前後左右）的空間，並持續預測自車與他車之間的空間交互關係。通過規劃出「未來一段時間內」的所有可行駛軌跡，篩選出最優、最高效的行駛路徑。

除此之外，理想汽車還對AEB（自動緊急制動）和AES（自動緊急轉向）進行了多項優化。在日常生活中的低速場景，特別是在地庫停車等複雜環境中，用戶可能會遇到柱子、墩子等障礙物。理想汽車的低速AEB能夠在這些情況下自動剎停，避免剮蹭，減少用戶的煩惱。

在高速行駛時，如果前車突然急剎並避讓，而當前的車與前車距離過近，無法及時剎停，理想汽車的AES功能會自動減速並緊急轉向避讓。這個功能在“消失的前車”場景中尤其重要，可以顯著提升行車安全。

目前，端到端自動駕駛已經成爲行業的共識。華爲、小鵬、元戎啓行、商湯絕影、零一汽車等主機廠和智能駕駛技術公司紛紛進入這一領域，並在最近半年陸續披露了上車量產規劃。

然而，端到端技術不是一項「一招鮮」的技術，它需要一整套支持系統才能真正發揮作用。以特斯拉爲例，雖然其他公司也在使用端到端技術，但效果卻不如特斯拉理想。特斯拉的成功不僅是因爲採用了端到端，還因爲他們在每個細節上都做得非常出色。不過，對在智能駕駛上的佈局雖然相對較晚的理想汽車，端到端還是讓它有了追趕的機會。

声明：本內容僅用作提供資訊及教育之目的，不構成對任何特定投資或投資策略的推薦或認可。更多信息

被吐槽「没技术」的理想，要为自己正名

被吐槽「沒技術」的理想，要爲自己正名

「紧跟」特斯拉

开城大战继续玩下去

「緊跟」特斯拉

開城大戰繼續玩下去

風險及免責聲明

聲明