Monthly Journal: Traders' Insights Wanted!
閲覧 361K
コンテンツ 3983
Li Autoがテスラを追いかけてスマートドライビングの取り組みを強化している理由
中国自動車重慶フォーラム(CACS)のちょうど1日前、Li AutoのCEOであるLi Xiangは、スピーチの焦点を人工知能から人工知能に変更するという自発的な決断を下しました 自動運転。フォーラムで、李氏は、将来の自動運転はエミュレートされるだろうと強調しました 人間の能力、迅速な応答時間と複雑なシナリオを処理するための論理的な推論を含みます。
その後のイベントでは、土壇場での変更についてある程度の洞察が得られます。1か月後、リー・オートが明らかにしたのは エンド・ツー・エンドのシステム ビジョン言語モデル(VLM)によって強化されています。
セグメント化されたアプローチを採用している国内のライバルとは異なり、Li Autoのソリューションは似ています テスラの「ワンモデル」 もっと綿密に設計してください。
歴史的にスマートドライビングの信奉者と見なされてきたLi Autoは、昨年、激しい競争の中で頻繁にアプローチを変えました。以前は、最初は高精細マップを使用し、次に軽量マップに頼っていました。 地図を破棄します 完全に。
マイクロソフトの最近のインタビューで 36Kr、スマート・ドライビング研究開発担当副社長のLang Xianpengと、スマート・ドライビング・テクノロジーR&D責任者のJia Pengが、Li Autoの継続的な道のりについて話しました。追いつくための努力を振り返って、ラングは、問題の本質を特定し、断固として迅速に修正することが基本原則だと推測しました。
を選ぶ エンドツーエンド(E2E) テクニカルルートはこの原則の延長です。Langは、これまでのスマート・ドライビング・ソリューションは根本的に マップベースです。彼らは、認識を持って統制を管理するという従来のプロセスに従いましたが、上流の欠陥には下流の調整が必要で、厳しいものでした 重要な投資.
しかし、中心的な問題は、リソース配分だけではなく、ルールベースのスマートドライビングには上限があり、 人間の運転を完全にエミュレートすることはまずありません.
組み合わせる VLMを使ったE2E そして、Li Autoが「ワールドモデル」と呼んでいるのは、自動車メーカーが今たどり着いた最適なパラダイムです。
簡単に言うと、Li Autoのアプローチでは、知覚、予測、計画、制御のために以前は分かれていたモジュールを排除し、それらを1つに統合します ニューラルネットワーク.
vLMは、システムのchatgpt関連と同様のプラグインとして機能します。E2Eシステムの動作は受信するデータによって異なりますが、 VLM 認知的かつ論理的な推論機能を提供します。複雑なシナリオでは、システムはリアルタイムでVLMに運転支援を問い合わせることができます。
ザ・リクシ・ ワールドモデル 大規模な問題セットとして機能し、再構築と製造方法を通じてシミュレートされたデータを生成し、Li Autoが以前に蓄積した実際のケースと組み合わせて、E2Eモデルに挑戦するための実際のテストシナリオとシミュレートされたテストシナリオを組み合わせて作成します。これらのテストで高得点を獲得したモデルのみがユーザーにリリースされます。
内部的には、これら3つのモデルはシステム1、2、3と呼ばれています。システム1は脳の即時思考モードに対応し、システム2は論理的思考に対応し、システム3はシステム1と2の学習成果を評価する試験モデルとして機能します。
E2E スマート・ドライビング・テクノロジーは テスラ2023年8月、CEOのイーロン・マスクは、V12バージョンで完全自動運転(FSD)技術の機能をライブストリームでデモンストレーションしました。ライブストリームはV12.5にバージョンアップされました。ただし、テスラとは異なり、Li Autoには E2Eとワールドモデルに加えてvLM機能もあります。
ジア・ペンは説明しました 36Kr 彼は米国西部と東部でそれぞれ1週間かけてエヌビディアのFSDをテストし、それが均一であることがわかりました E2Eテクノロジーには限界がありますs。ニューヨークやボストンなどの東海岸の複雑な道路状況では、エヌビディアの買収率が大幅に上昇しました。ジアは、HW3.0で実行できるE2Eモデルのパラメーターはそれほど大きくなく、モデルの容量には当然上限があると言いました。
Li Autoのデザイン VLM 役割は、システムの上限を増やすことを目的としています。VlMは、でこぼこの道路、学校、建設地帯、ラウンドアバウト交差点など、さまざまなシナリオから学ぶことができ、重要な意思決定のサポートを提供します。
LangとJiaはどちらも、VlMはLi Autoのスマートドライビングシステムにおける重要な変数だと考えています。パラメータはすでに22億に達し、応答時間は300ミリ秒ですが、より強力なチップを搭載すれば、VLMの展開可能なパラメータは数千億に達する可能性があり、レベル3および4の自動運転への最善の道筋となります。
「VlM自体も大規模言語モデル(LLM)の開発をフォローしていますが、最終的にパラメーター数がどれだけ大きくなるかはまだ誰にも答えられません」とJia氏は言います。
データ駆動型のビジョン言語モデルの軌跡に基づくと、スマートドライビング業界は現在、OpenAI、マイクロソフト、Teslaなどの企業によって開始された計算能力コンテストの一部になっているようです。
Langは、この段階での競争はすべてデータの量と質、そして計算能力に関するものだと率直に述べました。高品質のデータは絶対的なデータスケールに依存します-サポート レベル 4 モデルトレーニングに必要なのは 数十EFLOPSの計算能力.
「純利益が10億米ドルの企業で、将来の自動運転を買う余裕はありません」とラング氏は断言します。
現在、Li Autoのクラウドコンピューティング能力は4.5 EFLOPSで、ファーウェイのような大手企業とのギャップを急速に縮めています。によると 36Kr、Li Autoは最近、エヌビディアのクラウドチップを大量に購入し、入手可能な在庫のほとんどすべてをディストリビューターから購入しました。
李最高経営責任者(CEO)は、このような競争環境をよく知っており、リソースとインテリジェントテクノロジーを活用して競合他社を上回っています。彼はよくLangに、十分な計算能力があるかどうか尋ねます。そうでない場合は、会社のCTOであるXie Yanからもっと計算能力を調達するように頼みます。
車と 他のプレイヤーよりもお金が多い、Li Autoにはこの道のギャップを広げるチャンスがあります。財務報告によると、今年の第1四半期現在、Li Autoは 現金準備金 に近い 90億人民元(138億米ドル).
Li Autoのデータも、スマートドライビングの商業的ループが形になり始めていることを示しています。7月初旬、Li Autoは全国で運用可能な6.0スマートドライビングバージョンをMaxモデルのドライバーに提供し始めました。Langによると、Maxモデルの割合はすぐに 50% を超え、毎月 10% 以上増加しています。
Langは、レベル4の自動運転の長期的ビジョンが明確になってきているものの、その実装の道筋は変わっていないことも理解しています。「会社が車を売るのを早急に手伝う必要があります。車を売ることによってのみ、スマートドライビングを訓練するためのチップを買う余裕があります。」
もし スマートドライビング は自動車製造競争の決定的要因であり、競争が激しく、資源を大量に消費する分野です。Li Autoは、トップレベルの戦略計画、技術の進歩、および多額の資源投資を統合することにより、積極的に準備してきました。しかし、他はどうですか?
免責事項:このコミュニティは、Moomoo Technologies Inc.が教育目的でのみ提供するものです。
さらに詳しい情報2