IPA


公募結果一覧へ





2006年度上期 未踏ソフトウェア創造事業  採択案件概要


 



1.担当PM

   河野 恭之  (奈良先端科学技術大学院大学 情報科学研究科 助教授)



2.採択者氏名


開発代表者

戸田 智基 (奈良先端科学技術大学院大学 情報科学研究科 助手)

共同開発者

大谷 大和 (奈良先端科学技術大学院大学 情報科学研究科 博士前期課程2年)



関本 英彦 (奈良先端科学技術大学院大学 情報科学研究科 博士前期課程2年)



中村 圭吾 (奈良先端科学技術大学院大学 情報科学研究科 博士前期課程2年)



3.プロジェクト管理組織


   テクノロジーシードインキュベーション株式会社



4.採択金額


  8,275,000 円



5.テーマ名


 固有声変換法に基づく声質変換ソフト ウェアの開発



6.関連Webサイト

 戸田:http://spalab.naist.jp/~tomoki/index_j.html
 研究室:http://spalab.naist.jp/


7.申請テーマ概要

 言語の違いは音声コミュニケー ションを大幅に妨げる要因である。
自動音声翻訳や様々な言語のテキスト音声合成システムが存在する今、仮に、言語を問わず任意の音声の声質をユーザーのものへと変換できれば、ユーザーの音 声発声能力は大幅に向上する。
これは声質変換技術の応用例の一つである。この他にも、声帯を失った発声障害者による人工的な音声を、元の自分のような声質もしくは好みの声質へと変換で きれば、失われた音声発声能力は回復する。現状の声質変換技術では、入力話者と出力話者による50文程度の同一内容発声データ対から変換モデルを自動学習 する。
一度学習すれば、入力話者の声質は言語や発声内容によらず出力話者の声質へと変換可能となる。重大な欠点は、入出力話者各々に対して学習データが必要とな る事である。先の例のようにそのようなデータが収録不可能な場合は、この技術は使用できない。この問題に対して、我々は固有声変換法という技術を採用する 事で解決を試みる。本プロジェクトでは、固有声変換法に基づく声質変換用及び変換モデル学習用ソフトウェアの開発を行う。。



8.採択理由


 TTSから所望の人の声で合成音声が 出力できる.併せて権利関係フリーの音声DB作成のためにナレーター発声を収録する.アプリケーションは,声帯を失った人の発生機能の回復(=発声能力の 増強),自分の声・他者の声での合成音声出力など幅広い.基盤技術(ライブラリ)の開発だけでなく,UI面での作り込み(PM分野に関連したデモアプリを 少なくとも一つ作ること)を条件として採択する.PM担当の他Pjとのコラボレーションによる開発を強く推奨する.


  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004