| 人間の画像認識の仕組みにおいて、画像中の線要素の果たす役割は大きい。コンピュータでの画像認識に線を用いようと考えた場合、既存の線抽出アルゴリズムはみな人間の画像認識の仕方から離れた不自然なものとなっていることが多い。そこで画像中の線抽出アルゴリズムの一つとして、人間の画像認識の方法に近く自然で計算量も少ない、スプラインスキャン法を提案し、これを使用した画像認識ライブラリを作る。これにより画像中の曲線はスプライン曲線によりフィッティングされた細長い部分領域に抽出され、領域間は線の交差領域を介した二重リンク構造として接続される。抽出後のデータモデルはその後の画像解析で扱いやすい形となる。またこれを利用して、画像中の手書きの二次曲線群と特徴点の座標を認識し、厳密なデータに変換するようなプログラムを作成する。開発は、アルゴリズムを用いたライブラリを作り上げることにほぼ終始する。
アルゴリズムは単純には以下のとおり。
1. 画像を水平方向にスキャンし、黒画素の連続体であるスライス部分を抽出する。
2. スライス同士の接続性に着目し単連結な領域を得る
3. 単連結な領域をスプライン曲線で近似し、細長い線部分を得る。
4. 認識済みの領域をマーキングする。
5. 鉛直方向にもスキャンして1.2.3.4.を繰り返す。
6. どちらの方向でも認識されなかった交差領域を接続のジャンクションとする。
7. ジャンクションを介して全ての線部分を接続してデータ構造を形成する。
|