| モンゴル語は話者数に比して盛んに研究されている言語である。日本語との構造的な類似から、日本語における自然言語処理の成果の応用が期待できる。しかし、モンゴル語の自然言語処理のリソースは整備されているとは言いがたい。そこで、モンゴル語形態素解析器の開発を提案する。
形態素解析は、自然言語処理の基礎技術である。構文解析や機械翻訳といった次の段階の処理の基盤になるほか、全文検索などにも欠かせない。それ加えて、モンゴル語特有の事情であるが、キリル文字からモンゴル文字への変換も可能とする。
提案するモンゴル語形態素解析器は、次のような手順で開発する。
(1) 活用変化する名詞と動詞について、語生成ライブラリを作成する。母音調和や形態素接続にともなう語形変化など、モンゴル語特有の性質を考慮に入れた設計を行う。
(2) これに基づき、活用した名詞と動詞を形態素に分解する語分解モジュールを開発する。
(3) 語分解モジュールを用いた形態素解析器を開発する。これにより、活用しないその他の品詞にも対応し、文を入力として受け取り、形態素列を出力するシステムを完成させる。
(4) さらに、未知語、外来語の処理、重複法の処理、正書法に従わない通俗的な綴りへの対処など、実用上必要な処理も、モンゴル語の特性を生かして行う。
|