デジタル人材の育成

未踏IT人材発掘・育成事業:2025年度採択プロジェクト概要(守田・永井PJ)

公開日:2025年6月25日

1.担当プロジェクトマネージャー

  • 岡 瑞起(千葉工業大学 変革センター 主席研究員)

2.採択者氏名

  • 守田 竜梧(法政大学 大学院理工学研究科 応用情報工学専攻)
  • 永井 大地(法政大学 大学院理工学研究科 応用情報工学専攻)

3.採択金額

  • 2,880,000円

4.プロジェクト名

  • クリエイターの制作フローをトレースできる画像生成モデルの開発

5.関連Webサイト

  • なし

6.申請プロジェクト概要

近年、テキストや音声といった多様な入力情報から高品質な画像を生成できる画像生成モデル(例:Diffusion ModelやRectified Flow)に注目が集まっている。特にStable DiffusionやFluxのようにモデルがオープンソース化された事例では、学術分野のみならず一般ユーザを含む幅広いコミュニティで急速に応用が進んでいる。こうした先端技術を活用すれば、アニメ産業をはじめとする日本のクリエイティブ現場において、過酷な労働環境を改善できる可能性が高い。
しかしながら、アニメ制作やゲーム産業、広告業界などでは、構図を考え、前景を整え、背景を仕上げるというような段階的な制作フローが主流であるのに対し、多くの画像生成モデルは一括で1枚の画像を生成する、ランダム性の高い”ガチャ”のような手法となっており、これがクリエイターにとっての使いにくさを生じさせている。具体的には次のような問題が生じる。

  1. クリエイターにとって使い慣れない工程を強いられることで労働負担が増大する。
  2. 前景と背景を個別に編集しづらいため、修正のたびに最初から“ガチャ”を回すことになり、インタラクティブな操作が困難になる。
  3. 生成過程が不透明で、なぜその画像が得られたのか理解しづらく、不信感につながる。

これらの問題を解決するために、本プロジェクトではクリエイターの実制作プロセスに寄り添いつつ、最新の画像生成技術の強みを活かしたユーザフレンドリな画像生成モデルを開発する。本モデルにより、画像生成モデルの人間に対する説明可能性を高め、クリエイターが慣れ親しんだ段階的な作業手順に対応しながら、必要に応じて局所的な修正や要素の差し替えができるインタラクティブな操作を実現する。

7.採択理由

本提案において特に魅力的な点は、AIを使うクリエイターの現実的な課題に正面から向き合っていることである。「一括で画像を生成する“ガチャ”的な特性」という従来のDiffusion Modelの問題を的確に捉え、実際のクリエイティブ現場のワークフローに合わせたシステム設計を行う視点は、実践的で意義深いと思う。
特に革新的だと評価した点は、「構図→前景→背景」という段階的な作業プロセスへの対応と、必要に応じた局所的な修正や要素の差し替えを可能にするインタラクティブ性である。すでに一部成果がCVPR 2025に採択されている点も、このアプローチの技術的価値を裏付けるものとして注目した。
Latent空間内で前景と背景を統合的に扱うという技術的アプローチは、従来手法の限界を克服する重要なブレークスルーになると思われる。学術的な貢献と産業応用を両立させるこの取り組みは、技術による創造性支援の体現しており、日本のアニメ産業や広告・ゲーム業界に大きな変革をもたらす可能性を秘めていると考え、強く支援したいと判断した。

更新履歴

  • 2025年6月25日

    2025年度採択プロジェクト概要(守田・永井PJ)を掲載しました。