share_log

理想要和特斯拉掰手腕

理想はテスラと腕相撲を取りたいです

wallstreetcn ·  09/04 08:31

智能運営大戦。

大きい

著者 | 柴旭晨

編集 | 周智宇

一般の印象では、理想のスモートドライブは常に追いかける立場であり、しかし、ALL INエンドtoエンドに到達した後、理想はなんとテスラを超えたと自信を持って言います。

8月30日の成都オートショーで、理想オートモービルのスモードリブチームは「エンドtoエンド+VLM」ソリューションを詳細に発表しました。

これは現在の自動運転アーキテクチャの最終形態であり、この段階では、感知、意思決定、計画などのモジュールを明確に区別することはもうなく、元の信号入力から最終的なプランニング軌跡の出力まで、1つのディープラーニングモデルを使用して自動運転に完全かつ損なうことなく適用されます。

理想のスモードライブ開発副社長の朗咸朋によれば、最終形態のエンドtoエンドを徹底的に突破することこそが理想がカーブで抜かすための秘密です。

過去のAIドライビングのソリューションは、軽いマップまたはマップなしのどちらであっても、バックエンドの技術アーキテクチャは人手による設計要素があります。1年中のあらゆる状況を実行するには、1〜2年の時間がかかります。したがって、私たちはエンドツーエンド+ VLM技術アーキテクチャをイテレーションしました」と郎咸朋は述べています。「このアーキテクチャはAIが自己成長するものであり、実際には車が自動で走るようになりました。

理想は「ワールドモデル」の構築を始め、自動運転のAIトレーニングを加速させています。「ワールドモデルは、数千万のシナリオテストを生成およびシミュレートできるものです」と理想の自動運転高度アルゴリズム専門家の詹锟は述べています。これは、自動運転の迅速なイテレーションを実現するために最も重要かつ必要な保証であり、「ワールドモデル」は将来的にエンドツーエンドを圧倒する存在になるでしょう。

「それは現在の環境に基づいて未来を予測し、未来のシナリオを推論できます。例えば、ボールが道の真ん中に転がった場合、エンドツーエンドはただブレーキをかけるだけですが、ワールドモデルは後ろが変わらず、子供が飛び出してくるかどうかも考えます。それは、世界に対してより大局的かつ総合的な判断力を持っています」と詹锟は述べています。理想はエンドツーエンドに乗っているだけでなく、次世代技術のプリリサーチも既に行っています。

したがって、郎咸朋は自負して、「私たちはテスラとほとんど変わらない存在です、それどころか、少し先行しています」と述べています。

理想は特斯ラFSDと対抗することに躊躇しません。それは理想のデュアルシステムアーキテクチャの先進性だけでなく、新興勢力の中での先行する販売実績と資金力にもあります。郎咸朋は、エンドツーエンドを本当に実現するには2つの能力が必要であると述べています。「十分なデータと十分な計算能力があるかどうか、それはAIの訓練です」。

彼は言います、自社の自動運転システムを高度に訓練するために、理想はデータの品質要件が非常に高く、3%の「熟練ドライバー」データのみをAIに供給しますが、80万の車両基数の下で、データ量は既に十分に大きいです。また、これらのデータを処理するために、理想は今年末までに計算能力を8億EFLOPSに向上させる必要があります。「これには20億人民元の費用がかかります」。

郎咸朋によれば、高度な自動運転は大手企業しか遊べないゲームです。「L4段階に達すると、データと計算能力の成長は指数関数的になり、少なくとも年間10億ドルが必要です。企業の利益と収益だけでは投資を支えることは難しいです」とのことです。

エンドツーエンドの初期投入により、理想は迅速な販売変換を達成しました。次に、それはこの「ナンバーワンプロジェクト」を引き続き推進する必要があります。これは、比亜迪やテスラと並ぶ存在になるための鍵となるでしょう。

以下は、ウォールストリート・ジャーナル(華爾街見聞)とリーオート(理想)のアジアビッツ(智能)運営副社長ラン・シエンペン、アジアビッツ(智能)上級アルゴリズム専門家ジャン・クンとの対話の記録(編集による)です:

質問:真のエンドツーエンドとは何ですか?それをどのように評価すればよいですか?最適な効果とはどのようなものですか?

ジャン・クン:エンドツーエンドは、入力から出力までの開発パラダイムで、中間に他のプロセスはなく、1つのモデルで完全に実装されます。現在、リーオート車はOneModelエンドツーエンドとなっており、直接センサー入力を使用し、モデルの推論が完了すると直接軌道計画に提供され、これが一体化されたエンドツーエンドです。

市場には別のエンドツーエンドがあり、中間に2つのモデルがあり、モデル間にシグナルがブリッジとして使用されていますが、これは真のエンドツーエンドとは考えていません。中間に人為的な情報処理プロセスを加えると、効率が低下したり能力の上限が制限される可能性があると考えているからです。

ラン・シエンペン:現在、多くの人々が自分たちがエンドツーエンドモデルであると言っていますが、真のエンドツーエンドを行うには、2つの能力を見る必要があります:十分なデータと十分な計算能力があるかどうか。そうでなければ、真のエンドツーエンドを実現するのは難しいと思います。それはAIトレーニングだからです。

質問:多くのブランドが自分たちがリーダーであると主張していますが、リーオートもスマートドライブの第一線に立っているとし、自社のエンドツーエンドの技術レベルをどのように評価しますか?

ラン・シエンペン:一般消費者は技術ではなく体験に興味があり、私たちも他社とは競争しません。

かつて私たちは都市用のNOA(高度運転支援システム)を高精度地図を使用して検討しましたが、後に体験の要因によりマップレスに切り替えました。しかし、当時のマップレスは感知、計画、およびサブモジュールであり、多くの人工ルールと実車テストが含まれていました。

予算投入については置いておいて、時間的にも非常に困難です。四季折々の状況を実施するには、1〜2年間は不可能です。そのため、我々はエンドツーエンド+VLM技術アーキテクチャに再帰的に戻り、AIの解決策を自ら開発しました。

以前の運転支援は、システムが人間を助けて運転していましたが、エンドツーエンド+VLMの段階に入ると、私たちは車自体が運転すると考えています。完全なモデルを訓練した後、モデル自体がこの車を上手に運転する能力を持っています。私はこの車を監視し、どこか問題があったり、対処が必要なヒントがあったりする場合には介入しますが、主体は必ず車であり、人間は監視の補助的な役割を果たします。

質問:エンドツーエンドの開発サイクルはどのくらいですか?

郎咸朋:理想的には、エンドツーエンド+VLMの開発は昨年から始まりました。研究開発の段階では、非常に小さなチームで、部分的なモデルの研究およびエンドツーエンドの予研を行っていました。現在は、次世代技術の予研も進めています。成熟した条件と初めての検証になると、量産の段階に移行します。

質問:エンドツーエンドは最初にテスラが提案したものですが、テスラの影響を受けたのでしょうか?プロセスが確実に実行できるかどうか、どのように確認しますか?

詹锟:エンドツーエンドは特斯ラが最初に提案したものではありません。2016年、エヌビディアがこの技術を紹介したモデルがありましたが、その効果は一般的には特に単純なシーンの解決にしか用いられませんでした。当時の計算能力とモデルの規模から、この方法は通用しないと考えられていました。しかし、2023年に特斯ラは新しいtransformerアーキテクチャで非常に大規模な計算能力を持つことに成功し、より発展的な方向に進んでいます。

質問:理想社の自動運転技術とテスラの間の差はどのくらいですか?

郎咸朋:理想の場合、半年程度の差がありましたが、今年はもう少し縮まるかもしれません。技術アーキテクチャでは、特斯ラと大きな差はありません。むしろ、我々はVLMを持っているが、特斯ラはエンドツーエンドしか持っていません。中国でのトレーニングの計算能力とトレーニングデータでは、少なくとも現時点では私たちは特斯ラよりも先行しています。特斯ラは中国での計算能力展開が必要です。

その他、私達は世界モデルを使用することもあります。シーンを生成し、シミュレートできます。これは数千万のシーンテストを行うことで、スマートドライビングの迅速なイテレーションを実現する上で非常に重要で必要な保証です。この方法は、以前の車両全体または実際の道路試験よりもはるかに信頼性がありますし、1年中のすべてのシーンをカバーできます。

詹锟氏:世界モデルは、現在の環境に基づいて未来を予測し、将来のシナリオを推論することができます。例えば、ボールが道路の真ん中に転がった場合、一端からもう一端までブレーキしかしないでしょうが、世界モデルではまだ子供が出てくる可能性があるかもしれません。それはより総合的な世界判断を持っています。実際のところ、VLMは私たちのシステムではこの効果を発揮しますが、現在のモデルのスケールは非常に小さく、能力に限りがあります。

質問:最近、人々が「500億ドルではスマートドライビングを実現できない」という意見を出しましたが、リーオートはそれについてどのような考えを持っていますか?

郎咸朋氏:500億ドルに関しては、一度性投資なのか、長期投資なのかを判断する必要があります。今日言及したように、私たちはスマートドライブの研究開発に10億ドルの投資を毎年行っており、10年連続した場合、500億ドル以上の投資となります。

エンドツーエンド+VLMの技術アーキテクチャは、AIを実際に活用するための転換点です。

以前は、私たちは従来の方法でスマートドライビングを行っていました。全ての製品の最終的な効果は、「設計」によってあり、設計に含まれていないシーンは実現できませんでした。データのみを使用して駆動することはできず、人工の作業量も大きくなります。

統合されたエンドツーエンドモデルは、構造やトレーニング方法には難しさがありますが、最大の利点は、データを与えてモデルをトレーニングし、モデルが結果を出力する自然なAIトレーニングプロセスです。

私たちのエンドツーエンドモデルに基づくと、それに「老司机」と同じドライビング体験をするように指示するだけで、理想的な車主の「老司机」のドライビングデータを入力すると、結果を出してくれます。データの選別は非常に厳格で、当時の80万人の車主の中で、本当の「老司机」のデータはわずか3%しかありませんでした。

有了この前提の後、次に重要なのは、より多くかつより良いデータとそれに対応する計算リソースを使ってモデルをトレーニングすることです。そして、計算リソースとデータの入手には、それに何だけのお金とリソースを投入する必要があるかを見る必要があります。そして、その中にはお金では買えないものもあります。例えば、トレーニングデータやトレーニングの走行距離などです。各自動車メーカーがそれぞれのリソースを持っており、相互に共有することはありません。

もう1つの投資が必要なものは計算リソースです。現在、計算リソースは5.39億EFLOPSであり、今年の終わりまでに8億EFLOPSに達する予定であり、これは年間20億人民元の費用がかかります。

将来、L4段階に進むと、データと計算リソースは年々指数関数的に成長し、これは毎年少なくとも10億ドルの投資が必要であることを意味します。5年後、それは継続的なイテレーションを必要とし、このような規模では、企業の収益と利益が投資を支えることは非常に困難です。

したがって、今は自動運転に何十億を投資する必要はなく、本質的には十分な計算リソースとデータのサポートがあるかどうかを見てから、何だけ投資が必要かを考えるべきです。

質問:過去数年で自動運転の技術戦争は急速に変化し、大きなイテレーションを経験しましたが、今後も大きな変革は起こるでしょうか?

郎咸朋:エンドツーエンド+VLMデュアルシステムは人間の思考認知を模倣するアーキテクチャであり、私たちはAIを人間や人間に近いものにすることを最終目標としています。現在のAIフレームワークは非常に理にかなっており、多くの企業も追随し始めています。

デュアルシステム理論は自動運転にのみ適用できるだけでなく、将来的にはAIやさらにはsiasun robot&automationの範疇にも適用できるものです。自動運転は車輪型のasia vetsであると言えますが、その作業範囲は道路です。そのため、長期的な行動力を持つと考えられますが、技術の発展は無限であり、私たちは先進技術にアジャイルな感覚を保ち、新たな技術があれば追跡します。

質問:エンドツーエンドの量産納品後、販売台数にどれだけの増加をもたらしますか?

郎咸朋:画像なしの全%出来高プッシュ後、ここ2か月で私たちのテストドライブは倍になりました。30万以上の車種のAD Maxは70%を占め、以前のAD Proよりも多く、L9 AD Maxは90%以上を占めています。

質問:リーオートは上級運転支援に料金がかかる計画はありますか?どんな良いビジネスモデルがありますか?

郎咸朋:標準装備と無料はリーオートが運営を始めた当日からの運転支援へのアジアベットによる戦略です。「監督付き自動運転」は全AD Max車の所有者には無料で、さらに自動運転向けのトレーニングマイルを提供できます。したがって、配送が比較的良好かつ企業の運営が安定しており、十分なリソースを運転支援の研究開発に投入できます。

詹锟:リーオートは非常に豊富なデータを持っており、これらのデータは私たちが優位性を持つのをサポートできると信じています。そのため、より大きく、より難しいエンドツーエンドの一体化アーキテクチャに挑戦することを選択しました。その上限は非常に高いですが、トレーニングがより難しいという欠点があり、データの配分やトレーニング方法を探求・開発する必要がありますが、私たちは困難で正しい道を選択しました。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする