"魔法の自動運転ソフトウエア" E2E自動運転(FSD V12)が一体何なのかを一記事で分かる!
この記事は一部に自動翻訳を利用しています
先週、マスクはX(旧ツイッター)で、FSDは順調に進んでいるとコメントした。同氏は、FSD 12.4.1 がテスラの従業員にリリースされたと述べた。 順調にいけば、今週中には一握りの外部顧客にリリースされる予定という。
マスクはまた、FSD 12.4.1はV13と呼ぶべきほど進歩しているとコメントした。さらに、 $テスラ (TSLA.US)$段階にある他の2つのリリースは、それぞれV14とV15とするべきだと述べた。また、同氏は既知のバグが修正されれば、FSDが手動介入を引き起こすには1年以上の運転が必要になると付け加えた。
米テスラがFSD V12のリリースによる自動運転ソフトウエアを全面的に刷新する。キーワードは「エンド・ツー・エンド(端から端まで、E2E)」である。FSD V12のリリース以来、FSDのアップデートのスピードはどんどん速くなり、そのたびに大きな進歩を遂げてきた。
このような技術は「無制限に精度を高め、自動運転のコストを劇的に下げる可能性を秘め、実現すれば既存の自動車大手が自動運転ソフトでテスラに自力で対抗するのは難しくなる」と予想されている。
E2Eとは何か?
E2Eがこれまでの自動運転ソフトウェアとどう違うのかを具体的に知りたければ、まず、自動運転ソフトウェアがこれまでどのように動作してきたのかを理解する必要がある。
まず、構造的、今までの自動運転システムはサブモジュール的アプローチを取っている。 ADシステムは知覚、計画、制御によって分割され、まず、周囲の動的、静的な交通参加者と道路ネットワーク構造を正確に知覚し、次に、自動車両の走行軌道を計画し、最後に、閉ループ方式でアクチュエータを介して車両を制御する。 このような仕組みでは、人間の認知ステップをモデル化したモジュール間で、明確なインターフェースとインターフェイスが設計されている。
一方、テスラFSD V12のE2Eでは、このような仕組みではなく、知覚、計画、制御などのモジュールの間の断絶をなくし、主要なモジュールを組み合わせて大きなニューラルネットワークを構成している。
第二に、形式上、サブモジュール方式のソフトウェアは、手動コーディングとニューラルネットワークの組み合わせの形をとり、手動コーディングの割合が高い。 特に規制と制御の分野では、ほとんどの自動車会社はいまだにルール駆動型の伝統的なアルゴリズムと手動コーディングに頼っている。
一方、テスラのFSDのE2Eソリューションは、センサーデータを直接入力し、ステアリング、ブレーキ、加速信号を出力するフルスタックのニューラルネットワークを使用して実装されている。 理論的には、コーディングなしで全プロセスを実現できる。
第三、原理的、End-to-End Large Modelは、膨大な数の運転ビデオクリップを圧縮することで運転知識を抽出する。テスラのFSDは、GPTのようなLLMがインターネット・レベルのデータを圧縮するのと同様に、数千万ものビデオクリップから人間の運転知識をニューラルネットワーク・パラメータに圧縮する。人間の経験と同じように、運転知識もまた、人生におけるさまざまな経験を通じて、脳のニューロンやシナプスに蒸留され、刻み込まれる。
最後に、開発アプローチで考えると、フルスタック・ニューラルネットワークのFSD V12は、ソフトウェア2.0時代の産物であり、完全にデータ駆動型である。ニューラルネットワークの層数、構造、重み、パラメータ、活性化関数、損失関数が固定された後、トレーニングデータ(質とサイズ)がエンドツーエンドのニューラルネットワークの性能を決定する唯一の要因となる。
一方、サブモジュラーシステムは、ソフトウェア1.0と2.0の中間に位置する。 ニューラルネットワークを使用する部分を除き、手動コーディングを使用する他の部分は、依然としてデザインルールのメリットと従来のアルゴリズムの性能に依存している。
E2Eのメリットとデメリット
一般的に、E2Eは、①技術的な上限が高い、②複雑なフィットのロングテール問題に対するデータ主導の解決策、③深刻なモジュラー累積誤差の排除、という主な利点があると考えられている。
一方で、この技術は最近ヒットしたGPTのような生成AIと同様、その内部動作が作った人にとってもブラックボックスである「解釈可能性の不足」、大量の高品質データと膨大な演算能力が必要なため参加への障壁が高いなどの特徴もある。
出所:moomoo、Bloomberg
ーmoomooニュースZeber
この記事は一部に自動翻訳を利用しています
ーmoomooニュースZeber
この記事は一部に自動翻訳を利用しています
免責事項:このコンテンツは、Moomoo Technologies Incが情報交換及び教育目的でのみ提供するものです。
さらに詳しい情報
コメント
サインインコメントをする
Mr スコップ : イミフ
183819413 : 人間と同じように知覚情報を元に経験則にしたがって行動を決定しているのがE2E、プログラミングと同じように知覚情報をコーディングされたアルゴリズムにしたがって行動を決定しているのがサブモジュール。
前者はデータの蓄積量=経験則の網羅性=行動決定の精度向上となり、後者のコーディングの量=アルゴリズムの網羅性=行動決定の精度向上と比較すると学習スピードがまるで違うということですね。知らんけど
HONDA N-ONE : AIは勝手に交通ルールを覚えて運転技術が向上するわけだな