IPA


開発成果一覧へ





2004年度第2回未踏ソフトウェア創造事業  採択案件評価書


 



1.担当PM

 

 原田 康徳  (NTT コミュニケーション科学基礎研究所 主任研究員)



2.採択者氏名


 代表者

 新妻 弘崇 (独立行政法人 産業技術総合研究所 知的インターフェイス部門)

共同開発者

 なし



3.プロジェクト管理組織


 エヌ・ティ・ティ出版株式会社



4.委託金支払額

 

 3,378,851円



5.テーマ名

 

 リアルタイム処理可能な汎用画像認識検出エンジン



6.関連Webサイト


  http://www2s.biglobe.ne.jp/~niitsuma



7.テーマ概要


 近年のパーソナルコンピュータの処理速度の大幅な向上は,画像処理のような計算時間のかかる処理を,安価なパーソナルコンピュータでも高速に処理することを可能とした.本プロジェクトでは,特に画像認識,検出処理を高速に処理する手法を開発し,それによるリアルタイム処理可能な画像認識,検出処理の達成を目指す.
  開発の概要は,開発者が以前に開発したEquivalent Retina Sampling(ERS)と呼ばれる手法にいくつかの改良を行い,c++言語を使って高速処理可能な形でインプリメントする.この結果,顔認識における肌色認識のような特定の対象に特化したヒューリスティックによらない対象検出をめざす. アルゴリズムの詳細は文献[1][2]に記述されている.



8.採択理由

 

 これで開発されるソフトウェアがメディア処理分野に与えるインパクトは非常に大きい.
ARツールキットへの追加モジュールとして開発され,世界中のAR研究者やメディアアーティストに使われるのも夢ではないだろう.
 アルゴリズム自身にもセンスを感じた.




9.開発目標


 文献[1][2]において,高精度でなおかつ高速に処理できる可能性のある対象検出手法を提案した.しかし,この手法はMATLABという非常に処理の遅いプログラムで記述されており,高速性の証明は不可能であった.そこで本アルゴリズムをC++言語でインプリメントすることで提案したアルゴリズムの高速性を証明するのが目的である.




10.進捗概要


 本プロジェクトでは主に2つのソフトウェアを開発する.1つは,認識,検出したい対象の特徴を学習アルゴリズムにより抽出するソフトウェア.もう1つは抽出した特徴をつかってリアルタイムに対象検出するソフトウェアである.
  本プロジェクトでは学習アルゴリズムのソフトウェアは開発したが,望む性能を発揮できなかった.対象検出のソフトウェアは,デバック用の検出パターンを使って目的の性能である,リアルタイムに近い対象検出を達成していることを確認した.



11.成果


 近年, 画像処理によって物体を検出する手法が多数研究されている. 多くの手法は検出窓を動かしながら検出対象を発見するという手順を基礎としている. 単純化するならば,
 

 
という関数を, 様々なsub-image に適用することで対象を検出する手法である. 本プロジェクトでは, 評価関数

 

 

 

を定式化し, この評価関数に基づく次の対象検出方法をインプリメントした.

 

 

  この定式化の結果, 検出対象が入力された画像I の位置(x, y)に大きさs で存在する確率Pentire(x, y, s, I) はx, y, s についての多項式と指数関数, 対数関数の組合せで記述できるようになる. 評価関数Pentire(x, y, s, I) は下図 のよう定式化する. まず, 学習画像{T1, T2, T3, ...} の特徴分布を混合ガウス分布で近似する. この近似された結果を入力画像上でサンプリングされた輝度と比較する. このとき適当な窓関数Λ を使って適切でないサンプリング結果を無視する.

  以下が,本プロジェクトで開発したソフトウェアの全体図である.

 

 

  Pentireの最大点の計算は,本プロジェクトで新たに開発したEMアルゴリズムに基づく手法で行った.

 参考文献
 [1] H.Niitsuma:“A Non-Parametric Trainable Object Detection Model Using a Concept of Retinotopic Sampling”, accepted to International Journal of Computational Intelligence and Applications (2003)
 [2] H.Niitsuma: “Trainable Object Tracking using Equivalent Retinotopical Sampling”, 7th International Conference on Knowledge-Based Intelligent Information & Engineering Systems, LNAI,Springer-Verlag(2003).
 [3] Paul Viola and Michael J. Jones. Rapid Object Detection using a Boosted Cascade of Simple Features. IEEE CVPR, 2001



12.プロジェクト評価


 当初の計画から比べて,かなり進捗が遅れた.大きな原因は,転職という大きなイベントが開発途中に入ったためによる,開発時間の短縮であるといえる.本プロジェクトは,いま最も期待されている画像処理のテーマの一つといえる,高速な汎用画像認識に取り組んでおり,その成果が強く待ち望まれていた.幸い,今回未開発の部分は,技術的な問題というよりも時間的な問題で完成までに至らなかったということであるから,その完成を強く望む.

 



13.今後の課題


 本プロジェクトで開発する予定であった2つのソフト(特徴学習ソフト,対象検出ソフト)のうち特徴学習ソフトは,当初の予定の性能を実現できていない.この問題を解決することが今後の課題である.


  ページトップへ   





  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004