IPA






2006年度未踏ソフトウェア創造事業(未踏ユース)  採択概要


 



1.担当PM


  筧 捷彦



2.採択者氏名


代表者

宇野 雄介 (東京大学工学部電子情報工学科

共同開発者

 吉田 憲吾(東京大学大学院工学系研究科修士課程


3.プロジェクト管理組織


  株式会社 オープンテクノロジーズ



4.採択金額


  3,000,000



5.テーマ名


  スプラインスキャン法による曲線認識とその応用



6.テーマ概要 (応募時資料を一部分改訂)

人間の画像認識の仕組みにおいて、画像中の線要素の果たす役割は大きい。コンピュータでの画像認識に線を用いようと考えた場合、既存の線抽出アルゴリズムはみな人間の画像認識の仕方から離れた不自然なものとなっていることが多い。そこで画像中の線抽出アルゴリズムの一つとして、人間の画像認識の方法に近く自然で計算量も少ない、スプラインスキャン法を提案し、これを使用した画像認識ライブラリを作る。これにより画像中の曲線はスプライン曲線によりフィッティングされた細長い部分領域に抽出され、領域間は線の交差領域を介した二重リンク構造として接続される。抽出後のデータモデルはその後の画像解析で扱いやすい形となる。またこれを利用して、画像中の手書きの二次曲線群と特徴点の座標を認識し、厳密なデータに変換するようなプログラムを作成する。開発は、アルゴリズムを用いたライブラリを作り上げることにほぼ終始する。
アルゴリズムは単純には以下のとおり。
1. 画像を水平方向にスキャンし、黒画素の連続体であるスライス部分を抽出する。
2. スライス同士の接続性に着目し単連結な領域を得る
3. 単連結な領域をスプライン曲線で近似し、細長い線部分を得る。
4. 認識済みの領域をマーキングする。
5. 鉛直方向にもスキャンして1.2.3.4.を繰り返す。
6. どちらの方向でも認識されなかった交差領域を接続のジャンクションとする。
7. ジャンクションを介して全ての線部分を接続してデータ構造を形成する。



7.採択理由(担当PMからのコメント)

宇野君は,大学の3年生。みずからは「電気・電子工学一般を勉強中。情報系以外の勉強は割と苦手でかなり苦労している」というが,なかなかの勉強家と見受けた。提案は,画像認識の出発点ともなる「線」の認識に使われているHough変換を超えるものを作り出そうというもの。図形をスプライン曲線の集合とみて,そこにスプラインスキャン法と自ら名付けた方法を当てはめていくという。目標とするのは,2次曲線の(つもりの)手書き図形の自動認識程度をこなす,ライブラリの提供である。プログラミングの腕前の方は,大学での演習を超え,アルバイトでのソフトウェア開発でも磨いているという。共同開発者は,そのアルバイト先での上司でもある,同じ大学の先輩である。このプロジェクトの先には,今現在のコンピューアへの入力を超える,「紙」入力を夢見ている。その夢への第一歩を踏み出してくれることを期待する。




  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2006