share_log

为什么所有车企,都说要成为AI公司?

爲什麼所有車企,都說要成爲AI公司?

極客公園 ·  08/02 06:57

「一家成功的智能電動汽車公司,一定是一家成功的 AI 公司。」

這是汽車領域近兩年最時髦的一種表達,最近一次出自蔚來 CEO 李斌之口。李斌如今常常把企業家、投資人等一系列頭銜藏起來,以自媒體人自居,核心目的是要讓更多人了解一個真實的蔚來,不能因爲過往被打上了「服務好」的標籤,就認爲蔚來技術不好。

他說:「創新才是蔚來的底色。」

有過類似的表達的不只有蔚來一家。過往每家汽車公司都會有自己的標籤,例如操控感、豪華感、動力感、經濟性……但現在,大家有了一個新的共識:給自己貼上 AI 的標籤。

讓汽車變得更聰明,是第一個關鍵問題,也是車企們現階段需要儘快向用戶展示的重要能力。

但「變聰明」這三個字,本身又是一個很難量化的描述。怎樣才是一個聰明的機器呢?OpenAI 的首席技術官 Mira Murati 曾經試過在一檔播客節目中,用人類的智力水平類比過 AI 模型的能力:GPT-4 相當於聰明的高中生,而 GPT-5 有望達到博士的水平。

這種說法雖然通俗易懂,但其實很難直接套用在汽車上。因爲比起大模型本身,智能汽車作爲一個巨大的智能硬件載體,不僅要有「智力」理解問題,還要通過具體的「能力」解決問題。

如果把智能汽車比作機器人,那麼這個「人」變聰明的過程中,需要一個「聰明的大腦」——不僅要擁有模型本身的智力;還要負責爲「身體」制定一套合理的任務管理和分配體系,以確定不同「器官」需要在不同時候按怎樣的優先級處理一系列不同的任務。

舉個例子:主動懸架是這兩年很火的新功能,其核心就是根據記憶和計算,讓車輛在行駛過程中對懸架參數進行調節,以應對不同路面的顛簸程度,帶來更好的駕乘體驗。這涉及到了底盤、智駕等不同領域之間的配合。如果沒有一個統一的大腦協調,由於帶寬、延時等技術問題,配合就容易不協調,達不到想要的體驗。

7 月 27 日,在 2024 NIO IN 蔚來創新科技日上,蔚來發布了「整車大腦」——整車全域操作系統 SkyOS。這代表着蔚來對於 AI 時代的思考:據介紹,基於這一系統,可以在跨域任務執行、算力分配等方面提供更好的體驗。

而這些努力都是爲了同一個目標:讓智能汽車變得更聰明。

世界模型,讓智駕「會推理」

智能駕駛是 AI 上車關注度最高的場景,也是近年來技術路線變化最快速的一個領域。

過去幾年,智駕經歷過幾次技術路線的迭代,既有從高精地圖方案切換到無圖模式,也有以特斯拉爲代表的部分公司嘗試純視覺(去激光雷達)路線。

但這些路線的切換,本質上只是爲了降本,並沒有改變智駕「規則驅動」的本質。這個系統依然需要大量的程序員花心思寫代碼,改 BUG。換言之,這只是人類通過編程語言,把自己對於駕駛的認知翻譯給機器的一個過程,智駕系統本身並沒有產生智能。

端到端技術的出現,改變了這一套規則。規則驅動正在向數據驅動演進,人類試圖複製在大語言模型領域裏已被驗證成功的 Scalling Law,通過投餵大量視頻數據,把智駕系統訓練成一個可以湧現出智能的神經網絡大模型。

這種模式的最理想結果,是馬斯克曾經描述過的人類駕駛思考模式,即:輸入視頻(看到的路面信息),輸出控制(踏板及方向控制)。

套用「AI 三大基石」的理論,要達到這一目標,需要解決算力、算法、數據三大關鍵問題。

蔚來在數據上採取了「群體智能」的方式,即:基於大量預裝高算力、高配感知硬件的量產車獲得大量真實數據。據介紹,

算力則更是一個外部問題,並不由車企自身決定。

所以,下一階段的重點,是從算法本身出發,提高模型自身的訓練效率和推理能力。蔚來給出的下一個答案是:世界模型(Nio World Model,以下簡稱 NWM)。

你可以把 NWM 看成是 Sora 的一種變體,某種程度上也是一個視頻生成的產品。略有不同的是,Sora 主要依然基於「文生視頻」,而蔚來的世界模型則是一種「視頻生視頻」:根據官方介紹,NWM 可以將 3 秒鐘的真實駕駛視頻作爲提示詞,生成最多長達 120 秒的視頻。

但視頻生成顯然不是蔚來的目的,蔚來也不是要用 NWM 生成的視頻來做訓練數據。

仍然用人類的思維模式做比喻:在一個人類司機選擇超車前,TA 會根據實時路況判斷左右不同的變道路線以及選擇不同的超車時機。這一決策和推理的過程,NWM 通過一段生成的視頻,具象地表達了出來。

根據官方介紹,NWM 能在 100 毫秒內推演出 216 種可能發生的場景,並找到最優解。

所以,NWM 的出現,實際是通過生成式 AI 這條技術路線,找到了智駕系統在新工作方式(端到端)下變得更聰明的新路徑。

發掘座艙裏的「人味」

AI在汽車上的另一個深度應用場景,就是智能座艙。

如果你曾經分別體驗過一臺“傳統車”和一臺“優秀的智能汽車”,你應該不會認爲智能座艙裏的種種功能只是花拳繡腿。筆者一直認爲,在駕駛過程中,最安全的人車交互方式應該是通過語音——它可以保證你的視線和雙手繼續保持在對駕駛的關注當中。

可以說,在座艙智能化這件事上,具有互聯網基因的造車新勢力們顯然已經走在了很多傳統車企前面。

現在,當AI浪潮到來的時候,它們已經開始面對下一個選擇,就像前阿里董事會主席張勇說的那樣:

用AI的方法,把所有產品都重新做一次。

就目前來說,蔚來基本把目前市面上主流的 AI 軟硬件玩法,都搬到了車上。

例如 AI+音樂,通過 AI 加持的音質算法加成,爲缺乏全景聲的音源進行優化,再用車機自帶的硬件進行播放。

停車守衛功能在 AI 加持下,則變成了一個類似視頻會議紀要的產品。AI 會篩選生成值得關注的重點瞬間,如果不幸在停車時遭遇剮蹭等,這個產品就可以變成一個提效工具。

還有即將上車的旅行回憶功能。發佈會現場顯示了一段自駕遊之後,根據車載攝像頭捕捉的沿途風景自動剪輯生成的 vlog,其中還有一些標誌性山峯進行了地點標註。類似的 AI 剪輯功能,過往在運動相機等場景有過應用,如今蔚來也把它搬上了車裏。

除此之外,蔚來此次還展示了 NOMI 在多模態能力加持下的進化:可以看到「噓」的手勢,自動調低音量;也可以基於不同環境下,表達恰如其分的情感關心。

蔚來用「情感智能」描述了 AI 在座艙領域的進化。但在筆者看來,這些單一功能在 AI 本身的能力上並沒有非常巨大的突破,反而是想到這些實際應用場景,並且落地上車的決策值得關注。在座艙領域裏,也許目前應用場景的挖掘是先於模型能力進化的。

7 月 27 日晚上,結束了媒體採訪的李斌幾乎是馬不停蹄地進入了又一場線上直播。和過往無數次在網上發聲一樣,他又遇到了一些或尷尬或尖銳的問題,他選擇直接唸了出來:

「別天天整抖音了,用心管理公司吧。」

李斌笑着解釋這只是他第 5 次直播。但就像那些被藏進智能座艙裏,也許現在使用率還不高的小巧思一樣,他覺得蔚來在創新上的思考和努力是需要介紹給大家的,「不然大家每天都說蔚來服務好,就好像我們技術不好一樣。」

索性,這樣的表達收到了很多正面的反饋。李斌在媒體溝通會上自嘲道,以前大家說因爲一個人(指李斌自己)不買一臺車,現在也有很多人說要爲了一個人買一臺車,他很高興自己能做到這一點。

一旁的秦力洪補充了一句:以前大家最期待的是年底的 NIO DAY(蔚來日,蔚來車主最大的活動),我們希望以後蔚來 NIO IN 可以成爲媒體和車主最喜歡的活動。

期待這一天可以儘早到來。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論