share_log

被吐槽「没技术」的理想,要为自己正名

被吐槽「沒技術」的理想,要爲自己正名

極客公園 ·  07/10 02:48

隨着特斯拉FSD(完全自動駕駛)進入中國市場的步伐加快,各大車企紛紛跟進,推出自己的端到端大模型方案。

6月,$理想汽車-W (02015.HK)$董事長兼CEO李想在2024中國汽車重慶論壇上表示,理想汽車將在今年三季度推出無圖NOA(自動輔助導航駕駛),最早今年年底最晚明年年初,推出基於理想自研大模型和VLM視覺模型的L3級自動駕駛系統。同時,隨着這套技術的演進、算力的增強、模型的加大,無監督的L4級別自動駕駛至少三年內一定可以實現。

7月5日,理想汽車舉辦了理想 2024 智能駕駛夏季發佈會。這次發佈會李想並沒有出席,而是由三位技術專家介紹了理想智能駕駛的現在和未來。

在發佈會上,他們以對話的形式,介紹了最新的端到端+VLM雙系統智能駕駛模型,通過世界模型的學習和思考環境,這一系統將加速自動駕駛技術的迭代。

同時,理想推出的OTA 6.0版本智能駕駛升級,將引入無需高清地圖的NOA功能,並覆蓋理想MEGA和理想L9、L8、L7、L6的AD Max車型,惠及超過24萬名用戶,實現全國範圍內的智能駕駛體驗。

目前,多家廠商都在追逐「端到端」,但理想汽車是首個公開技術方案的車企。那麼,理想的「端到端」方案到底有何特殊之處呢?

「緊跟」特斯拉

作爲自動駕駛行業的標杆企業,特斯拉的技術路線一直備受關注。自2023年5月, 伊隆·馬斯克首次公開提到「特斯拉FSD v12是一個端到端AI」,到2024年3月,特斯拉開始大規模推送v12版本,特斯拉的端到端技術不斷進步的過程,也見證了中國自動駕駛行業逐漸達成共識的歷程。

儘管行業內對端到端的發展趨勢已形成普遍共識,但在具體技術路線上的分歧仍然存在。例如,「模塊化端到端」採用監督學習的訓練方式,而「單模型端到端」可能更傾向於自回歸和生成式的訓練方法。

理想這次公佈的自動駕駛方案,有點類似Momenta的雙系統模式。其理論來源是諾貝爾經濟學獎得主丹尼爾·卡尼曼的《思考,快與慢》理論,提到了認知心理學裏系統 1 與系統 2 的概念。其中,系統 1 是基於人們過去的經驗和習慣形成的直覺,能夠迅速做出決策。系統 2 則代表着思維推理的能力,面對複雜問題和未知場景,人們需要思考、推理來解決。總之,系統 1 和系統 2 相互協作,構成了人類認知和理解世界以及做出決策的基石。

具體到理想汽車的自動駕駛技術架構,主要靠三個部分來實現:系統 1 由端到端模型(E2E)實現,主要用於快速響應常規駕駛問題。這個系統經歷了三個階段:

  • 模塊化設計,包含感知、定位、規劃、導航、NPN,支持了 100 個城市的 NOA。

  • 無圖模式。只有感知和規劃兩個模型,最大的變化是去掉了NPN,不依賴於先驗信息

  • 類似特斯拉的 One Model的端到端模型,只有一個模型,輸入的是傳感器,輸出的是行駛軌跡。

系統2是視覺語言模型(VLM),具備處理複雜場景的能力。它由Transformer模型組成,將提示詞(Prompt)文本進行分詞編碼,並將攝像頭圖像和導航地圖信息一起傳輸給模型進行自回歸推理。系統2的輸出包括環境理解、駕駛決策和駕駛軌跡,然後傳遞給系統1來控制車輛。

與大多數單幀的VLM模型不同,理想設計了流式視頻編碼器,能夠緩存更長時間的視覺信息。此外,系統還增加了記憶模塊(Memory bank),可以緩存多幀歷史信息,從而解決長時間序列推理時延的問題。

可以這樣理解,系統2就像是一位智能導航和決策專家,它不僅能夠看到當前的路況和環境(攝像頭圖像),還能夠根據地圖信息和用戶的指令(Prompt文本)來進行決策和規劃行車路徑。

與此同時,理想汽車介紹了端到端方案的測試和驗證方法。一般來說,業內主流的做法是通過3D虛擬環境、重建仿真、生成仿真等進行仿真測試。理想則結合了重建仿真和生成仿真兩種技術路徑。

可以用一個比方來說明:假設你在準備考試,有兩種題型需要練習:真題和模擬題。真題是過去考試中實際出現過的問題,模擬題則是根據考試大綱編寫的新題目。真題可以讓你熟悉考試的風格和類型,而模擬題可以幫助你應對可能出現的新情況。

理想的測試方法類似於這個準備過程。他們先使用3D高斯濺射(3DGS)技術,像是真題一樣重建真實場景,然後利用生成模型,像是模擬題一樣補充新的視角。這樣一來,他們創建的測試環境既真實又多樣,可以更全面地評估自動駕駛系統的表現。

此外,他們採用了動靜態分離的策略,就像是分開練習不同類型的題目:靜態部分是環境重建,動態部分則是對動態物體進行重建和生成新視角。通過這種方法,他們創建了一個360°可編輯的3D物理世界,能夠模擬各種不同的駕駛條件,比如天氣變化、時間不同、車流量等,來全面測試自動駕駛系統的適應能力。

開城大戰繼續玩下去

除了自動駕駛新架構,理想汽車還發布OTA 6.0版本的智能駕駛升級,帶來無需高清地圖支持的NOA功能。這次升級將覆蓋理想MEGA以及理想L9、L8、L7、L6的ADMax車型,惠及理想超過24萬名用戶。

在2023年,中國智能駕駛行業的焦點集中在「城市NOA開城大戰」。目前,華爲和小鵬已經推出了無需高清地圖的高階駕駛輔助功能,蔚來也推出了全域領航輔助NOP+城區功能。

這次,理想也緊隨其後。據了解,理想汽車最新發布的無圖NOA(導航輔助駕駛)功能不僅可以在城市和城鎮中行駛,還能適應二級道路。相比之前的版本,新版無圖NOA在BEV(鳥瞰視圖)、感知能力、規控能力以及整體系統能力上都有了全面提升,能夠應對更多複雜的行駛環境。

發佈會上,理想汽車拆解了無圖NOA的四大核心能力,其中最值得關注的是前兩個:

  • 哪裏都能開。無圖NOA無需依賴大量的「先驗信息」。理想汽車的智能駕駛系統中有許多「小機器人」在運行,雖然部分「小機器人」可能仍需一些先驗信息,但整體能力的提升,使得系統能夠更靈活地應對各種路面情況,而無需事先驗證。

  • 繞行絲滑。該能力結合了時間和空間的雙重規劃。在實際駕駛中,常常會遇到車輛或行人阻礙通行。這時,「繞行順暢」能力就顯得尤爲重要。其背後的時空聯合能力,可以同步規劃橫縱(前後左右)的空間,並持續預測自車與他車之間的空間交互關係。通過規劃出「未來一段時間內」的所有可行駛軌跡,篩選出最優、最高效的行駛路徑。

除此之外,理想汽車還對AEB(自動緊急制動)和AES(自動緊急轉向)進行了多項優化。在日常生活中的低速場景,特別是在地庫停車等複雜環境中,用戶可能會遇到柱子、墩子等障礙物。理想汽車的低速AEB能夠在這些情況下自動剎停,避免剮蹭,減少用戶的煩惱。

在高速行駛時,如果前車突然急剎並避讓,而當前的車與前車距離過近,無法及時剎停,理想汽車的AES功能會自動減速並緊急轉向避讓。這個功能在“消失的前車”場景中尤其重要,可以顯著提升行車安全。

目前,端到端自動駕駛已經成爲行業的共識。華爲、小鵬、元戎啓行、商湯絕影、零一汽車等主機廠和智能駕駛技術公司紛紛進入這一領域,並在最近半年陸續披露了上車量產規劃。

然而,端到端技術不是一項「一招鮮」的技術,它需要一整套支持系統才能真正發揮作用。以特斯拉爲例,雖然其他公司也在使用端到端技術,但效果卻不如特斯拉理想。特斯拉的成功不僅是因爲採用了端到端,還因爲他們在每個細節上都做得非常出色。不過,對在智能駕駛上的佈局雖然相對較晚的理想汽車,端到端還是讓它有了追趕的機會。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論