自動運転と「フィジカルAI」の関係性は?実世界で物理的動作

NVIDIAトップが提唱



AI関連業界で、「フィジカルAI」という言葉がパワーワードとして浮上している。NVIDIAのジェンスン・フアンCEOが提唱したとされており、大幅な進化を遂げたAIがデジタルの壁を破り、実世界で物理的な動作を可能とする技術領域だ。


その象徴の一つが自動運転だ。高度な認識・判断能力を有するAIが車両を自律走行させる様は、フィジカルAIを体現するかのようだ。

フィジカルAIの概要とともに、自動運転分野との関連について解説していく。

編集部おすすめサービス<PR>
車業界への転職はパソナで!(転職エージェント)
転職後の平均年収837〜1,015万円!今すぐ無料登録を
タクシーアプリは「DiDi」(配車アプリ)
クーポン超充実!「無料」のチャンスも!
新車に定額で乗ろう!MOTA(車のカーリース)
お好きな車が月1万円台!頭金・初期費用なし!
自動車保険 スクエアbang!(一括見積もり)
「最も安い」自動車保険を選べる!見直すなら今!
編集部おすすめサービス<PR>
パソナキャリア
転職後の平均年収837〜1,015万円
タクシーアプリDiDi
クーポンが充実!「乗車無料」チャンス
MOTAカーリース
お好きな車が月々1万円台から!
スクエアbang!
「最も安い」自動車保険を提案!

■フィジカルAIの概要

高度なAIが物理的動作を実行する

フィジカルAIは、ざっくり言うと高度な認識能力や判断能力を伴い物理的な動作を行うAIだ。ロボットなどの移動体・可動体に搭載されたAIが、センサーなどの情報をもとにリアルタイムで自律判断し、ボディの制御を行う。

言葉としては、NVIDIA創業者兼CEOのジェンスン・フアン氏が言い出しっぺとされているが、概念自体は昔からあるものだ。


NVIDIA創業者兼CEOのジェンスン・フアン氏=出典:NVIDIAプレスリリース

言わば、自律判断能力を有する高性能AIがフィジカル=ボディを持ったようなものだ。AIの能力を現実のアクションに結びつける形で、判断能力を活用して自らのボディを動かす――ということだ。

現在流行している生成AIは、基本的に文章や画像などのデジタルデータを生成・アウトプットするもので、現実世界に物理的な影響を及ぼさない。しかし、大規模言語モデルなどで培われた読解能力や認識能力などが、AIに新たな目と脳をもたらした。

カメラなどのセンサーが取得したデータから周囲のオブジェクトや状況を認識・把握し、空間全体を把握したうえで判断し、物理法則に基づいて自らのボディをどのように動かすかを決定していくのだ。

大規模言語モデルや生成AIなどで飛躍的に向上した認識・判断能力をもとに、ボディをどのように動かせば最良の結果を生み出せるか、AIと物理的な動作を結びつけたものがフィジカルAIだ。


ソフトバンクもフィジカルAIに注目

フィジカルAIに関しては、ソフトバンクのビジネスブログの解説がわかりやすい。同ブログでは、生成AIとフィジカルAIの違いについて、生成AIの目的は知識の創造・効率化で、デジタルコンテンツとして出力され、デジタル空間で活用される。主な役割は情報の生成・処理・分析となる。

一方、フィジカルAIの目的は現実世界の作業自動化・自律化で、物理的タスクの実行・操作に向け、動作・制御信号によって現実世界(フィジカル空間)で活用される。

フィジカルAIを支える技術としては、タスクの意図や状況を理解し、行動を決定するAIと、把持・移動・操作など、実世界での動作を担うロボティクス(身体・制御)、周囲の情報を収集し、AIの判断材料を提供するセンシング(環境把握)、データを低遅延で処理し、AIとロボットをつなぐ通信インフラ・エッジ処理、事前学習や動作検証により精度を向上させるシミュレーション/データ生成――を挙げている。

AIの理解力や環境認識能力が大幅に進化しており、これらがフィジカルAIを実現する基盤となっている。加えて、アクチュエータ制御などロボティクス分野の性能向上も進んだことで、フィジカルAIは現場環境で正確に状況を把握し、必要な動作を安定して行えるようになってきたという。

その活用シーンは、今後どんどん広がっていく見込みだ。これまで人間が担っていた現場作業において、特有の判断や適応が必要な作業は自動化が難しいとされていた。しかし、フィジカルAIの登場やロボティクスの進化により、さまざまな現場で人間のタスクを代替できる可能性が芽を出し始めた。

活用シーンとしては、物流・製造(搬送・ピッキング)や建設・インフラ(点検・メンテナンス)、医療・介護(介助・搬送)、飲食業・サービス業(サービス支援・配膳ロボット)、災害対応・危険作業(レスキュー・調査)、モビリティ/自動運転(自律移動)が挙げられている。

出典:Waymoプレスリリース

自律判断能力を不問とすれば、AI搭載のロボットはすでに物流や飲食などの分野で広く導入が進んでいる。例えば、倉庫内や飲食店内などでカメラやLiDARセンサーにより周囲の状況を把握しながら所定の動作を行う自動搬送ロボットなどだ。

柔軟な思考・制御は伴わないものの、一定の命令に従って配膳などのタスクを担っている。あらかじめプログラムされた単純作業を実行するイメージだ。

これが本格的なフィジカルAIに進化すれば、例えば飲食店でそろそろ注文しそうな客のもとに出向いて様子をうかがったり、食事を終えたタイミングでデザートを勧めたり……といった行為も可能になるかもしれない。刻々と変化する現場の状況に応じ、「~番テーブルの注文とってきて」といった言語

倉庫であれば、個々の荷物の収納場所を指定しなくても、仕分け・分別しながら最適なスペースに収納してくれそうだ。工場などでは、センサーによる目視で不足する部品などを把握し、部品を運んでくれるかもしれない。

どれだけ人間に近い現場認識と判断を行い、行動に結び付けられるかがフィジカルAIのカギとなりそうだ。

▼フィジカルAIとは? 生成AIとの違いや活用例を分かりやすく解説|ソフトバンク ビジネスブログ
https://www.softbank.jp/business/content/blog/202601/what-is-physical-ai

■フィジカルAI×自動運転

エンドツーエンドモデルがフィジカルAIを体現

フィジカルAIの活用シーンの一つであり、開発が先行している分野がモビリティ領域における自動運転だ。特に、エンドツーエンドモデルの技術はフィジカルAIを体現していると言える。

従来のルールベースに基づく自動運転システムは、半フィジカルAIと言える。走行するエリアや速度上限などを厳密に設定し、エリア内を入念にマッピング化したうえで自律走行させる手法だ。

センサーによる周辺認識や判断など、要素ごとに異なるAI・コンピュータを用い、これらを統合する形で自律走行するのが一般的だ。

周辺の状況をリアルタイムで検知・判断しながら「クルマ」というボディを制御・操作するため、フィジカルAIと言える。一方、その判断と制御はあらかじめ学習した範疇でのみ発揮され、自ら進んで学習を積み重ねることはない。

あらかじめプログラムされたシーンの範疇で、あらかじめプログラムされた状況判断に基づいて行動するため、想定外の事態に柔軟に対応することはできない。想定外の事態に陥った際は、安全な手法で車両を停車させるよう設計されている。自律的判断の面を踏まえると、初歩のフィジカルAIといった感じだ。

一方、エンドツーエンドモデルによる自動運転システムは、高精度3次元地図のようなデジタルインフラや事前に学習した内容に大きく依存することなく、その場の状況に応じて柔軟に判断できる点がポイントだ。

強化学習を重ねて精度を上げた自動運転システムは、走行中に取得したセンサー画像をリアルタイムで分析し、その場その場で安全走行に向けた判断を行う。想定外の初めてのケース、例えば馬に乗った人が道路上に現れても、それは自転車に相当するのか、車両に相当するのかなど類推して善後策を判断し、対応する。

所定の命令を実行するため、その過程において試行錯誤しながら柔軟に学習を積み重ねていくイメージだ。判断が結果として誤ったものであれば、修正を加えて改善していく。この現場の判断力と応用力の高さが、フィジカルAIに必須の重要な要素となる。

AIには、さまざまな現場でいかに論理的思考を瞬間的に働かせられるか、そしてその論理思考の根拠を明示することができるかが問われる時代となりそうだ。

以下、フィジカルAIに近いエンドツーエンドモデルの開発を進める企業を紹介していく。

■自動運転開発企業の動向

フィジカルAI開発の代表格はテスラ

出典:Tesla公式サイト

自動運転分野において、フィジカルAIを体現する企業の代表格は米テスラだろう。テスラは早くからAIファーストの開発体制を構築し、人間を模す形で自動運転開発を進めてきた。

人間の目に近い機能としてLiDARを使わずカメラにこだわり、物体の認識能力を磨くとともに、走行エリアなどの制限を設けず、周辺情報をもとに柔軟に運転制御を行う人間のような自動運転システムの開発を進めている。

その成果は着実に表れており、同社の自動運転システム(現状は運転支援システム)「FSD (Full Self-Driving) Supervised」は、市街地をはじめとする広範囲でハンズオフ運転に相当する自動運転レベル2+を実現している。

オールド自動車メーカーはまだ市街地でレベル2+を実現する水準に達しておらず、新興中国系メーカーとともに業界トップを独走している状態だ。

数百万台に及ぶテスラのオーナー車両から匿名で走行データを収集し、強化学習を重ねてシステムの向上を図っており、特定のエリアや環境に左右されず、周囲の状況をリアルタイムで認識したうえで判断を下すレベル5相当の技術開発を進めている。

2025年にロボタクシーサービスをテキサス州オースティンで開始したが、こちらはジオフェンスを設定するなど、現状レベル4相当を意識した取り組みとなっている。

現実問題として、自動運転可能な条件(ODD)を設けないシステムは、安全性を担保しにくく規制当局の許可もおりにくいものと思われる。実現にはまだまだ時間がかかりそうだが、いざ実用化水準に達すれば、その技術は自動運転業界の勢力図を一変するほどのものとなる。

また、テスラがフィジカルAIの代表格と言える根拠として、ヒューマノイドロボット「Optimus(オプティマス)」の開発を進めている点が挙げられる。

イーロン・マスク氏としては、自動運転車もヒューマノイドロボットも特段の区別なく、フィジカルAIとして捉えているものと思われる。それぞれ実行できる役割は異なるものの、現実世界を認識し、一定の役割を遂行するためボディを制御するということに変わりはないためだ。引き続き同社の動向に注目したい。

イーロン・マスク、自動運転でGoogleに「降参」?テスラ、主軸をロボットに転換か

NVIDIAもソリューション展開に注力

「フィジカルAI」という言葉を生み出したNVIDIAは、「NVIDIA Omniverse」などフィジカルAI実現に向けたソリューション展開に躍起となっているようだ。

同社は2025年8月、Accenture、Avathon、Belden、DeepHow、Milestone Systems、Telit Cinterion などの企業と連携し、物理的な AI ベースの認識と推論によって世界中の業務を強化すると発表した。

フィジカルAIを推進し、物理的な AI のシミュレーション、トレーニング、展開を継続的に繰り返すことで、洗練された産業オートメーション機能を提供し、都市とインフラをより安全でスマートかつ効率的なものへ変えていくという。

同年3月には、ロボット工学や自動運転開発を推進するオープンな物理AIデータセットを発表している。初期データセットはHugging Faceで公開されており、開発者はロボット訓練用の32万超の軌跡を表す15テラバイトのデータに加え、SimReadyコレクションを含む最大1,000個のUniversal Scene Description(OpenUSD)アセットを利用できる。

エンドツーエンドの自動運転開発を支援する専用データ(1,000以上の米国都市とヨーロッパ24カ国を網羅する多様な交通シナリオを収録した20秒のクリップを含む)も近日公開予定としている。

Turingも将来ヒューマノイド開発へ?

国内では、自動運転開発スタートアップのTuringに注目したい。同社は創業当時からエンドツーエンドモデルに特化した開発を進めており、カメラ画像から直接AIが車両に指示を出すシステム開発を手掛けている。

出資を受けているGMOインターネットとの対談で、創業者兼CEOの山本一成氏は「純粋な言葉の世界やソフトウェアの世界はLLMによって相当なレベルに達した。しかし、身体性を持ったAIの実現は、少しずつできてきているとはいえまだ難しい」とフィジカルAIの現状に触れている。

そのうえで、「自動運転はまさにこの身体性を持ったAIの典型例。カメラをメインとしたセンサーを入力とし、単一のニューラルネットワークで処理し、アクチュエーターを制御する。私の考えでは、ヒューマノイドロボットも自動運転も最終的にはほぼ同じ技術に行き着く。自動運転が一定のレベルに達したら、次はヒューマノイドを作らなければならないと考えている」と述べている。

同社は2025年7月、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構が実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC」の第3期に採択されたと発表した。

テキスト・映像・センサー・制御信号を高次に理解するマルチモーダル AI をベースに、実車両と連携して動作するフィジカル基盤モデルの開発を進めるそうだ。

■【まとめ】自動運転開発におけるパーセプション技術が大活躍?

物理的動作を伴うAI制御の線引きが難しいところだが、柔軟な判断能力に基づく動作を実現することが重視されるため、ルールベースではなくエンドツーエンドモデルがフィジカルAIに相当すると考えられる。

現実世界の認識は、カメラなどのセンサーによるパーセプション技術が第一のカギを握り、自動運転開発で培われた同技術が今後他分野に展開されていく可能性が高い。

フィジカルAIというものが、今後どのように進化しソリューション化されていくのか。自動運転業界としても非常に興味深いところだ。

【参考】関連記事としては「自動運転と「Sim-to-Real」の関係性解説」も参照。

記事監修:下山 哲平
(株式会社ストロボ代表取締役社長/自動運転ラボ発行人)

大手デジタルマーケティングエージェンシーのアイレップにて取締役CSO(Chief Solutions Officer)として、SEO・コンテンツマーケティング等の事業開発に従事。JV設立やM&Aによる新規事業開発をリードし、在任時、年商100億から700億規模への急拡大を果たす。2016年、大手企業におけるデジタルトランスフォーメーション支援すべく、株式会社ストロボを設立し、設立5年でグループ6社へと拡大。2018年5月、自動車産業×デジタルトランスフォーメーションの一手として、自動運転領域メディア「自動運転ラボ」を立ち上げ、業界最大級のメディアに成長させる。講演実績も多く、早くもあらゆる自動運転系の技術や企業の最新情報が最も集まる存在に。(登壇情報
【著書】
自動運転&MaaSビジネス参入ガイド
“未来予測”による研究開発テーマ創出の仕方(共著)




関連記事