自動運転向けのAI(人工知能)開発を手掛ける米Helm.aiが、リアルな運転シーンの動画を生成するAIモデル「VidGen-1」を発表した。一般的な走行環境から希少なユースケースまでさまざまな環境を事実上、無限に生成可能なようで、自動運転開発をより効率的に前進させることができるソリューションとなりそうだ。
社会的に話題となっている生成AIは、自動運転分野でもそのポテンシャルを存分に発揮することが期待される。Helm.aiの取り組みをはじめ、生成AI×自動運転の未来に触れていこう。
記事の目次
■Helm.aiの取り組み概要
AIがリアルな動画を生成
動画生成AIモデル「VidGen-1」は、先進的なディープニューラルネットワークアーキテクチャとHelm.ai独自の教師なし学習技術「Deep Teaching」を組み合わせ、リアルな運転シーンの動画を生成する。
数千時間に及ぶ多様な運転映像のデータに基づいてトレーニングされており、都市部や郊外環境、歩行者、自転車、交差点、曲がり角、さまざまな車両、雨や霧などの気象条件、グレアや夜間などの照明効果、濡れた路面や反射する建物の壁、車のフードに映る正確な反射に至るまで、世界の多数の都市にまたがるさまざまなシナリオのリアルな動画映像を生成可能という。
動画は384×640の解像度で、最大30fpsのフレームレート、数分間の長さで、画像や短い動画によるプロンプトで、または入力プロンプトなしでも生成できる。
従来の非AIシミュレーションと比較し、自動車メーカーなど開発者に顕著なスケーラビリティの利点を提供する。迅速なアセット生成が可能となり、シミュレーション内のエージェントに洗練された行動を取り入れることができる。
開発時間とコストを削減するだけでなく、「シミュレーションから現実へ」のギャップを効果的に埋めることで、シミュレーションに基づいたトレーニングと検証の適用範囲を大幅に拡大し、リアルで効率的なソリューションを提供する。
同社CEO兼共同創業者のVladislav Voroninski氏は「動画生成AIにおける技術的なブレークスルーを達成した」とし、「数年にわたるディープティーチング技術と生成DNNアーキテクチャに関するイノベーションを組み合わせることで、現実的な動画を効果的かつスケーラブルに生成する手法を実現した。弊社の技術は汎用的であり、自動運転、ロボティクス、その他の動画生成が必要なあらゆる分野に等しく効果的に適用できる」と話す。
また、「動画における次のフレームの予測は、文章における次の単語を予測することに似ているが、はるかに高次元。運転シーンのリアルな動画を生成することは、自動運転における予測の最も進んだ形態で、この技術は運転において次に何が起こるかを予測することに関連しているため、自動運転にとって非常に重要」としている。
ディープティーチング技術を軸にAI開発
Helm.aiは、AI開発における「教師なし学習」に焦点を当てた独自技術で自動運転分野にイノベーションを起こすべく2016年に設立されたスタートアップだ。
カメラなどのセンサーが物体を認識するパーセプション領域において、「これは歩行者(人)」「これは自転車」などAIに各オブジェクトを教えるラベリング作業が必要な「教師あり学習」と比較し、教師なし学習はラベリングを行わず、AIが物体の特徴をもとにグループ分け・分類する。
AIは自らが分類したオブジェクトが何かは分からないものの、結果として人や自転車などの各オブジェクトを分類し、それぞれの区別を明確にしていくのだ。ラベリング作業が不要なため、開発効率は非常に高い。
同社は、この教師なし学習を飛躍的に進歩させる技術・手法「Deep Teaching(ディープティーチング)」を導入し、パーセプション分野を中心としたAI開発を加速している。
ビジネスモデルとしてはライセンスを計画しているで、パーセプションをはじめ経路計画や車両制御など、高度なADAS(先進運転支援システム)からレベル4自動運転に至るまでの各種AIソフトウェアの提供を目指しているようだ。
【参考】Helm.aiについては「「教師なし学習」で自動運転!ホンダも出資するHelm.aiの正体」も参照。
ホンダが出資、自動運転開発を加速
Helm.aiに対しては、ホンダが早くから目を付けていたようだ。ホンダ・イノベーションズがグローバルに展開するオープンイノベーションプログラム「Honda Xcelerator Ventures」が2020年にHelm.aiとのパートナーシップを開始し、自動運転ソリューションの研究開発を加速している。
その後、2021年、2022年と2回にわたって出資も行っている。グローバル自動車メーカーとしてはホンダが唯一Helm.aiに出資しているようだ。同社のシリーズCラウンドまでの総資金調達額は1億5,500万ドル(約248億円)となっている。
【参考】ホンダの出資については「ホンダ追加出資!自動運転企業Helm.aiが3,100万ドル新規調達」も参照。
生成 AIシミュレーションも発表
Helm.aiは2024年4月、VidGen-1のベースとなる忠実度の高い仮想運転環境を実現する生成 AIシミュレーションを発表している。
大規模な画像データセットを使用してトレーニングした生成AIに基づくシミュレーションモデルで、地理や道路環境、天候、道路標識などさまざまなパラメータの変化を含むリアルな仮想運転環境の画像を生成できる。
また、生成された合成画像には、周囲のエージェントや障害物、歩行者、車両、車線標識など、運転環境に関する正確なラベル情報が含まれており、大規模トレーニングや検証に使用できるラベル付き合成画像データとなる。
ユーザーは、テキストまたは画像ベースのプロンプトを提供することで、現実世界をリアルに再現する高忠実度の運転シーンの生成や、完全に合成された環境を作成できる。これらAIベースの生成シミュレーション機能を使用することで、自動運転におけるパーセプションシステムのスケーラブルなトレーニングと検証が可能になるとしている。
物理ベースのシミュレーターは、物理的相互作用やリアルな外観を正確にモデル化する複雑さに制限されるが、生成AIに基づいたシミュレーションは現実世界の画像データから直接学習するため、非常にリアルな外観のモデル化や、簡単なプロンプトによる迅速な仮想運転環境の生成、多様な運転シナリオやODD(運行設計領域)に対応するために必要な拡張が可能になる。
■生成AI×自動運転
パーセプション技術をはじめ応用範囲は拡大中
機械学習や強化学習、深層学習に代表される近年のAI開発は熱を高め続けているが、対話型AI「Chat GPT」を機にブームと呼べるほど活用が大きく進み始めたのが生成AIだ。学習したデータをもとに新たなデータを生成するもので、入力した言語データなどをもとにテキストや画像、音声などを作成することができる。
Helm.aiのVidGen-1は、この生成AIを応用する形で自動運転開発に活用できるリアルな動画を効率的に生成するものだ。
自動運転業界でも、パーセプション技術の開発領域を中心に生成AIの活用が加速度的に進んでいる。センサー画像をもとにオブジェクトを検知し、周囲の状況を把握するパーセプション領域では、あらゆる状況下でさまざまなオブジェクトを識別することが求められる。
この開発には、無数とも言える膨大な走行データ・画像を必要とする。公道走行における周囲の環境・シチュエーションは走行するたびに変わるため、可能な限りあらゆるデータを分析し、精度を高め続けなければならない。ある意味終わりのない作業だ。
ここに生成AIを導入し、さまざまな交通環境下におけるリアルな画像や動画を量産できれば、作業効率は大きく向上する。現実の走行ではなかなかお目にかかれないレアな状況もリアルに生成することができる。
国内では、AI開発力を武器とするTuringが2023年3月に自動運転向けの国産LLM(大規模言語モデル)開発に着手したと発表している。
「言語を通じて高いレベルで世界を認知・理解する」というLLMの本質から、自動運転AIに「人間と同等以上に世界を理解させる」ためにはLLMのアプローチが有効と判断し、マルチモーダルAIの開発などを進めている。
同年6月には、LLMを搭載した自動運転車を発表し、走行デモを行っている。巨大なニューラルネットワークによりカメラ映像から直接運転指示を出力する「End-to-End(E2E)」のAIと生成AIにより、2025年中に東京都内の一般道で人間の介入なしに走行できる自動運転AIを実現するとしている。
生成AIが、爆速とも言える同社の開発速度を支える1つの柱になっているのは間違いなさそうだ。
【参考】Turingの取り組みについては「Turing、完全自動運転EV「2030年10,000台」宣言 半導体チップも製造へ」も参照。
ティアフォーはHMI関連に生成AIを活用
ティアフォーは2023年10月、「考え、話す車」というコンセプトに基づいた自動運転インターフェース「CT3」を開発したと発表した。
強力なGPT-3.5/4 LLMと自動音声認識(ASR)、テキスト読み上げ(TTS))などの高度なAI技術を活用し、車が人間と思考し対話することを可能にしたという。
自動運転車においては、クルマ・コンピュータと人をつなぐHMI(ヒューマンマシンインタフェース)が重要性を増す。こうした面でも生成AIが大活躍することになりそうだ。
【参考】ティアフォーの取り組みについては「「しゃべる自動運転車」実現 ティアフォー、生成AI技術を活用」も参照。
マイクロソフトはCerenceやボッシュと提携
OpenAIに出資しているマイクロソフトは2024年1月、音声×AI技術を事業軸に据える米Cerenceとの提携を発表した。Microsoft Azure OpenAI Serviceを通じてChatGPTテクノロジーを統合し、次世代の生成AIを活用した車内体験推進に向け協業していくこととしている。
また、マイクロソフトとボッシュは2024年2月、自動運転機能のさらなる向上に向け生成AIの研究・活用を推進していくと発表した。
生成AIによって車両が状況を判断し、それに応じた反応ができるようになることで交通参加者の安全性はさらに高まる。車内の利便性向上を含め、自動車固有のAIの専門知識や生成AIに提供するための車両センサーデータへのアクセスなど、さまざまな観点から研究を進めていくようだ。
【参考】Cerenceの取り組みについては「地味に重要!BMWの自動運転車、「救急車の音」検知機能を実装」も参照。
■【まとめ】生成AIの活用がスタンダードに?
膨大なデータを必要とする自動運転開発において、半ば制限なくデータを生み出すことができる生成AIは今後どんどん存在感を増し、近い将来スタンダードな技術へと変わっていきそうだ。
おそらく、開発各社はすでに水面下で活用、あるいは活用を模索しているものと思われる。HMIや車内エンタメなど含め、活用事例が続々と表舞台に出てくることは間違いない。
生成AIにより自動運転開発がどれほど加速・進化していくか必見だ。
【参考】関連記事としては「自律型AI、2036年に80兆円市場へ!自動運転など実用化加速へ」も参照。
大手デジタルマーケティングエージェンシーのアイレップにて取締役CSO(Chief Solutions Officer)として、SEO・コンテンツマーケティング等の事業開発に従事。JV設立やM&Aによる新規事業開発をリードし、在任時、年商100億から700億規模への急拡大を果たす。2016年、大手企業におけるデジタルトランスフォーメーション支援すべく、株式会社ストロボを設立し、設立5年でグループ6社へと拡大。2018年5月、自動車産業×デジタルトランスフォーメーションの一手として、自動運転領域メディア「自動運転ラボ」を立ち上げ、業界最大級のメディアに成長させる。講演実績も多く、早くもあらゆる自動運転系の技術や企業の最新情報が最も集まる存在に。(登壇情報)
【著書】
・自動運転&MaaSビジネス参入ガイド
・“未来予測”による研究開発テーマ創出の仕方(共著)