|
言語の違いは音声コミュニケー
ションを大幅に妨げる要因である。
自動音声翻訳や様々な言語のテキスト音声合成システムが存在する今、仮に、言語を問わず任意の音声の声質をユーザーのものへと変換できれば、ユーザーの音
声発声能力は大幅に向上する。
これは声質変換技術の応用例の一つである。この他にも、声帯を失った発声障害者による人工的な音声を、元の自分のような声質もしくは好みの声質へと変換で
きれば、失われた音声発声能力は回復する。現状の声質変換技術では、入力話者と出力話者による50文程度の同一内容発声データ対から変換モデルを自動学習
する。
一度学習すれば、入力話者の声質は言語や発声内容によらず出力話者の声質へと変換可能となる。重大な欠点は、入出力話者各々に対して学習データが必要とな
る事である。先の例のようにそのようなデータが収録不可能な場合は、この技術は使用できない。この問題に対して、我々は固有声変換法という技術を採用する
事で解決を試みる。本プロジェクトでは、固有声変換法に基づく声質変換用及び変換モデル学習用ソフトウェアの開発を行う。。
|