デジタル人材の育成

未踏IT人材発掘・育成事業(ユース):2009年度上期採択プロジェクト概要(鎌土PJ)

1.担当プロジェクトマネージャー

後藤 真孝(産業技術総合研究所 情報技術研究部門 メディアインタラクション研究グループ長)

2.採択者氏名

  • チーフクリエータ
    鎌土 記良(奈良先端科学技術大学院大学 情報科学研究科 音情報処理学講座)

  • コクリエータ
    鈴木 翔太(奈良先端科学技術大学院大学 情報科学研究科 音情報処理学講座)

3.未踏プロジェクト管理組織

  • リトルスタジオインク株式会社

4.採択金額

  • 3,000,000円

5.テーマ名

  • オーディオオブジェクト操作機能を有する圧縮符号化ソフトの開発

6.関連Webサイト

  • なし

7.申請テーマ概要

近年、計算機性能向上によって信号のマルチチャネル化や音質改善、多様なエフェクトなど、多くの音響技術が発展してきている。信号のマルチチャネル化によって、ホームシアター用5.1chサラウンドシステムなどのマルチチャネルシステムが普及し始めており、7.1chや9.1chとチャネル数は増加し続けている。DVDやBlu-ray Disc、地上波デジタル放送などがマルチチャネル信号に対応しているため、今後もマルチチャネルシステムの普及が進むと考えられる。

また、オーディオのエフェクト技術は、単にトーンを変えるだけでなく、臨場感さえもコントロールすることが可能となっている。単純なトーンコントロールだけでなく、部屋の広さに代表される空間的印象さえも制御できるようになり、これらの技術は制作者のみならず、ユーザー側においても可能になった。そして、近年、オーディオ信号に含まれる各オーディオオブジェクト(例えば、ギター、ピアノ、ボーカルなど)に対してエフェクト処理ができるような、ユーザーがオーディオをより柔軟に制御できるシステムの研究・開発が盛んに行われている。

このような背景の元、Moving Picture Experts Group(MPEG)では、MPEG-Surroundを拡張した技術として、ユーザーがオブジェクトの定位感を自由に操作できる圧縮技術Spatial Audio Object Coding(SAOC)の標準化(MPEG-SAOC)を進めている。しかし、現状のSAOCでは、原理上、音質劣化や、現在市場において大半のシェアを占めるミックスダウンが施されたCD、DVD、Blu-ray Diskなどの混合音源や実環境にて収音された音に対して用いることができない問題点がある。

本提案では、高音質、高圧縮効率で既存混合音源においてもユーザーが各オーディオオブジェクトの操作を行うことができる新たな技術の開発と、この技術を用いユーザーが手元でヴィジュアルに既存音源における空間音情報を操作、好みの音を演出可能なこれまでに類を見ない画期的なオーディオソフトウェアの開発を行うことを目的とする。

8.採択理由

ユーザが自分好みの臨場感を得られるように、オーディオオブジェクトの操作が可能な音響技術を実現する提案である。

要は音源の定位を自由に操作できるようにするインタフェースを提供するということであるが、技術的なポイントは、ミックスダウン前の音源情報を使わずに、音楽CDのようなステレオ収録された楽曲に対しても適用できることである。 

精度と操作性をどこまで上げられるかが大きな挑戦ではあるが、それ以上に、実際に提案しているようなインタフェースを実現するには、各方向の音がどの楽器かを特定する必要があり、音源分離にも取り組まなければならない。

鎌土君、鈴木君は、面接の質疑でかなり厳しい質問を私が連発したにも関わらず、まったく動じずに、自分達にはやれる、という姿勢で議論ができたのは、素晴らしかった。

本当に使いたいと思えるものに仕上がるかどうかが鍵であり、それには高い信号処理性能と魅力的なインタフェースが不可欠である。どこまで達成してくれるのか、その技術力に裏付けされた意気込みと元気に大いに期待したい。