デジタル人材の育成
公開日:2026年5月29日
本プロジェクトは、音声から2Dモーフィング技術を用いてアバターの表情・動作をリアルタイムに生成するAI基盤の構築を目的とする。従来の2Dモーフィングモデルの制御では、カメラを用いたフェイストラッキングや音素抽出を介したルールベースでのリップシンク等が主流である。また、深層学習を用いた音声ベースでの制御手法も近年開発されているが、未だ計算コストと制御の遅延において課題がある。本提案手法では、従来のカメラ依存型表情推定や大規模GPUを前提とした生成モデルとは異なり、リザバーコンピューティングを用いることで、低計算資源下でも安定かつ滑らかなモーション生成が可能となることが期待される。さらに、少量データによる短時間の再学習で個々の話者やキャラクターの癖を反映するパーソナライズも可能となる。
これにより、ゲームやライブ配信、ビデオ通話、遠隔教育、福祉など幅広い分野において、カメラ不要かつ低計算負荷で利用可能な次世代の対話型アバター基盤技術を構築する。従来の端末依存や心理的・身体的制約を軽減するとともに、端末上で処理を完結させることでプライバシーを保護し、誰もが手軽に感情豊かなアバター表現を行える環境の実現を目指す。
リザバーコンピューティングを用いて音声から、それに対応したキャラクター(アバター)の表情をリアルタイムに生成するプロジェクト提案である。リザバーコンピューティングの効率性を活かして、エッジ側の計算のみで少数データから個人に特化したリアルタイム2Dモーフィングを構成することは理にかなっており、誰でも気軽に使用できる技術の開発が期待される。音声情報からどれだけ感情を含む豊かな表情を生成できるかに挑戦してほしい。また、言語情報の使用可能性やキャラクターの表情を作る上での誇張表現の有効性など多くの興味深い検討事項にも取り組んでほしい。
2026年5月29日
2026年度採択プロジェクト概要(山本PJ)を掲載しました。