2024年12月25日-27日,理想汽車連續三天推出「2024理想 AI Talk」,分享了對人工智能的最新思考,以及包含智能駕駛和理想同學在內的人工智能技術的最新進展,並宣佈基於自研基座大模型Mind GPT的理想同學從車機進入手機,App已於12月27日全量上線。此外,理想汽車宣佈OTA 7.0版本車機系統將於12月底全量推送AD Max用戶,新增AI推理可視化、高速端到端等功能,並實現Mind GPT-3o、Mind Diffusion V2.0的能力升級。
理想同學和智能駕駛是理想汽車的兩大核心AI產品。理想汽車董事長兼CEO李想表示:「我們在做的理想同學和自動駕駛,通常被視作獨立的領域。我們的大語言模型Mind GPT是認知智能,連接數字世界;而自動駕駛被稱爲空間智能,關乎物理世界。我們同時在這兩個領域探索,並堅信認知智能與空間智能的結合——我們稱之爲VLA(Vision Language Action Model,視覺語言行動模型)——是一個更值得相信和追求的機遇。」
李想表示,理想汽車的願景已升級爲「連接物理世界和數字世界,成爲全球領 先的人工智能企業」,汽車是連接這兩個世界的最 佳橋樑。
「從企業角度來看,理想汽車是一家人工智能企業,我們要做的不是汽車的智能化,而是人工智能的汽車化,並將推動人工智能普惠到每一個家庭。從行業視角來看,汽車將從工業時代的交通工具,進化成爲人工智能時代的空間機器人。在對整個世界的理解上,我們通過人工智能將物理世界與數字世界進行融合,讓有限的空間實現無限的延伸。」李想表示。
理想同學App,隨時隨地陪伴你的智能助手
理想同學App是一款人工智能應用,目前具備兩大功能:「知識問答」提供多領域的問答能力,包括汽車、出行、財經、科技等領域,並能處理多種文本任務,如撰寫文章、翻譯和創作文案等;「看世界」依靠視覺感知能力,幫助用戶識別菜單、畫作、動植物、汽車等上千種通用物品。
從車機進入手機,理想同學從智艙智能助理轉變爲通用智能助手。從用戶需求的角度出發,這是一件順理成章的事情。很多理想汽車用戶的孩子首次接觸的人工智能產品就是理想同學,它通過對話幫助孩子們解決各種問題,比如畫畫或寫作業等。理想汽車希望讓100多萬的車主及其家庭成員,不僅在汽車,還可以在手機、電腦,甚至眼鏡等穿戴設備上,體驗到一致的人工智能產品。其次,從長遠角度來看,理想汽車認爲,在掌握基座模型的前提下,真正的大模型產品會覆蓋所有的設備,能讓用戶自主使用所有的服務。
目前,大模型技術尚處於發展早期,很多團隊仍停留在聊天機器人的初始階段,所有參與者都有探索未知邊界的機會。理想汽車憑藉100多萬的家庭基礎和在自動駕駛領域的技術積累,能夠在追隨優秀競爭對手的同時,實現更有效的投入。
L3有監督智能駕駛,不是L2輔助駕駛的延續,而是L4自動駕駛的先導
在自動駕駛的不同階段,L3爲有監督智能駕駛,不是L2輔助駕駛的延續,而是L4高度自動駕駛的先導程序。
輔助駕駛只實現了特定功能,自動駕駛則關乎整體能力。傳統的L2輔助駕駛依賴上一代自動駕駛方案,通過預設條件來執行不同場景下的智駕功能,無法窮盡所有的corner case(極端情況)。理想汽車借鑑人類駕駛技能提升的過程,用人工智能的方式做自動駕駛,推出了端到端+VLM的雙系統解決方案,利用Scaling Law(規模效應)不斷迭代和提升自駕能力,以適應所有可能的駕駛環境。
自7月底推出端到端智能駕駛的內測版以來,理想汽車以每週更新兩個模型版本的頻率,致力於在今年將綜合MPI(城市+高速平均接管里程)提升至100公里。展望未來兩年,還將逐步提升MPI至500公里甚至1000公里以上。爲了達到MPI 500公里的目標,預估需要2000萬Clips(視頻片段),意味着積累50億公里甚至超百億公里的數據量。
隨着端到端+VLM雙系統的不斷迭代,理想汽車希望在2025年實現L3有監督智能駕駛,併爲用戶提供一個全場景、一體化端到端的產品。理想汽車認爲,達到L3的前提是實現「車位到車位」的智能駕駛,這將自動駕駛服務從幹道提前到小區車位,解決最 先100米和最後100米的挑戰。11月底,理想汽車已全球首家全量推送「車位到車位」功能,有效應對了小區道路、環島、掉頭和複雜施工的場景。
此外,理想汽車將在12月底通過OTA 7.0版本車機系統向所有AD Max用戶全面推送「高速端到端」和行業首創的「AI推理可視化」功能。其中,「高速端到端」將實現高速特殊場景NOA不降級、不斷點、更連續,使理想汽車成爲國內唯 一一家、全球第二家將端到端技術應用到高速(及環路)NOA場景的車企。「AI推理可視化」通過展示10種可能的策略軌跡並實時選出最 佳方案,同時以熱力圖形式直觀展現端到端系統在不同區域的關注度,將幫助駕駛員更直觀地理解AI的決策邏輯。
安全,是體驗的基石。雖然理想汽車在國內率先取消了角毫米波雷達,轉而採用以純視覺爲主的技術路線,但仍然保留了激光雷達,並將其視作「安全帶」,與視覺技術配合,以期達到消除所有重大傷亡事故的目標。通過持續的OTA升級,理想汽車爲用戶提供了行業領 先的安全能力,包括全自動緊急轉向AES(自動緊急轉向)、全速域無上限激活AEB(自動緊急制動)、及城市路口多方向人車混行場景AEB等。至今,安全技術已成功預防超415萬起潛在事故,超1000起烈性事故,一定程度上保障了駕駛安全。在OTA 7.0更新中,理想汽車還將向AD Max用戶升級應對大霧天氣的高速智駕策略,實現業內場景覆蓋最全ELK(緊急車道保持輔助)。
得益於今年理想汽車在智駕領域的快速進步,截至12月中旬,AD Max銷量佔比已從2月份的約20%增長至50%以上,30萬以上車型AD Max銷量佔比已超75%。
在技術、產品、環境政策,以及消費者對人工智能信任度到位的前提下,理想汽車有望在三年後推出首 款爲L4級自動駕駛定義的汽車。在此之前,企業也必須滿足3個條件:500萬輛以上規模的車隊、掌握VLA基礎模型的能力、有足夠多的錢去招募最頂 級的人才以及足夠的算力。
應用AI技術,推動快速成長
目前,理想汽車超100億的年研發投入已有接近一半聚焦於人工智能,並建立了四支AI團隊,分別解決不同問題。
在智能駕駛領域,憑藉充足的訓練里程和先進的訓練算法,加之利用世界模型創建的模擬環境,理想汽車推出了行業首創的端到端+VLM雙系統方案。該方案自7月底啓動早鳥計劃以來,以每週兩次的頻率迭代更新,在10月底正式全量推送,11月底新增「車位到車位」功能,並將在12月底推出「高速端到端」功能。隨着數據規模的擴大和數據質量的提升,理想汽車已經成功驗證了Scaling Law在提高自動駕駛性能方面的作用。截至12月25日,理想汽車智駕總里程已達29億公里,訓練算力提升至8.1EFLOPS。
在理想同學方面,其搭載了自研的行業首 個車載認知大模型Mind GPT。截至目前,該模型已積累10萬億Token的預訓練數據,覆蓋自動駕駛、對話等場景中特有的多模態數據。自2023年12月發佈以來,Mind GPT已迭代30多次,將伴隨OTA 7.0進入到第三階段,即Mind GPT-3o,進一步發展任務助手、認知成長和情感陪伴能力。與前兩代側重語言模型不同,Mind GPT-3o將通過構建融合感知和認知的多模態端到端大模型能力,大幅降低人機交互延遲。
在智能商業方面,理想汽車通過大模型技術與商業領域數據和知識的深度結合,構建了一批具備零售、營銷、客服、金融、財經分析等能力的AI助手。例如,在零售領域,AI通過學習零售專家的溝通技巧,爲更多零售夥伴培訓、賦能;在客戶服務方面,AI模型掌握了豐富的車輛使用知識,通過智能的多輪對話有效解決用戶諮詢,提升服務效率、釋放呼叫中心的坐席壓力等。
在智能工業方面,理想汽車通過全棧自研的智能製造系統、視覺算法、設備、質量預測模型等,依託於Li-MOS生產管理系統、連山雲端質量預警平台、MESS系統等自研的智能化平台構建起智能製造超級大腦,橫向上實現從研發端到交付端的數據閉環,縱向實現多層供應鏈到整車廠的數據協同,以數據驅動生產、快速迭代生產技術,從而持續提高製造效率和產品質量。
理想汽車AGI實現的戰略地圖
爲了實現AGI,理想汽車發佈三階段的戰略路線圖。
第 一階段稱爲「增強我的能力」。在這一階段,理想同學能爲用戶提供輔助功能,自動駕駛領域實現L3有監督智能駕駛。此時,AI技術已經能顯著提升人類的工作效率和便捷性,但AI還無法獨立,需要人類來兜底。
第二階段叫做「成爲我的助手」。AI將推進至L4級別的自動駕駛與Agent階段的理想同學。例如,用戶可以簡單地指示一輛L4級別的汽車去接孩子,無需親自在場,車輛就能自行前往學校,通過面部識別技術讓孩子安全上車。在這個階段,理想同學代表的認知智能,與自動駕駛代表的空間智能,將會結合成一個模型,理想汽車稱之爲VLA。AI會出現大規模的應用,是真正的iPhone4時刻。
第三階段升級爲「成爲我的硅基家人」。人類不再需要向AI發出任何指令。AI能夠延續並運用人類的記憶,自主做出決策,並主動執行多項任務,成爲家庭的重要成員。硅基家人是AGI的最終產品。
從智能電動車企業升維轉型爲人工智能企業,未來,理想汽車將始終把用戶價值放在第 一位,秉持「超越用戶的需求,創造讓我們自豪的產品和服務」的企業價值觀,爲更多用戶創造移動的家,創造幸福的家。