IPA


開発成果一覧へ





2005年度上期 未踏ソフトウェア創造事業  採択案件評価書


 



1.担当PM

   北野 宏明 (株式会社ソニーコンピュータサイエンス研究所 取締役副所長)



2.採択者氏名


開発代表者

遠藤 拓己 (フリーランス)

共同開発者

徳井 直生 (フリーランス)


3.プロジェクト管理組織


  財団法人 国際メディア研究財団



4.委託金支払額


  8,380,000



5.テーマ名


  Phonethica (フォネティカ) - 異言語間の偶然的音声連鎖で世界を探索するシステム



6.関連Webサイト


  http://www.phonethica.net 、 http://www.inexhale.net 、 http://naotokui.com




7.テーマ概要


 
2005年現在、5000種とも6000種ともいわれる地球上の言語の50%から90%が、今世紀中にも消滅するという。
 Project Phonethica(以降プロジェクトともいう)は、私たち人類の言語の、特にその音声的な特質を媒介にして世界の多様性を探り、その成果を芸術の魔力と科学テクノロジーによってダイナミックに散種することで、断片化の末の混沌を謳歌する現代社会を生き抜けていくための実践的な方法を探しだすことを目的とするプロジェクトである。
 本提案では、プロジェクトの基幹となるシステム「Phonethica System」の開発を行う。

 Phonethica Systemは、世界言語データベース(Phonethica Database)、音声近似比較アルゴリズム(Phonethica Process)、グラフィックユーザーインターフェース(Phonethica Desktop)で構成され、世界のあらゆる言語の間を飛び越え、音声的に近似の言葉を探し出す(例えば仏語の"Ca-va"と日本語の鯖)。探し出された言葉は同時にそれぞれの背景情報と結びづけられ、ユーザーはそれらの情報をテキスト、サウンド、写真、動画、グラフィック、タイポグラフィといったメディアにより体験する。 例えば、その言語の語彙や文法、学術的な分類、世界人口における話し手の割合や地理的分布に関する情報から、その言語を話す人々の生活風習、芸術、文学、音楽、宗教、歴史、地理や気候、さらには現在の経済並びに政治情勢に関する情報までもが次々と前景化し、コラージュされ、そしてまた情報の海へと溶け込んでいく。

 このようにして、これまで一度も関連づけられたことがなかったその意味も用法も異なる二つの単語が、「音」という共通項によって確率的に結びつけられ、そこに、新たな価値を持つインターフェース、多様性と多様性をつなぐインターフェースが生成される。
 偶然性の連鎖によって点と点が緩やかに関係しはじめ、やがて次なる運動を誘発し、さらに、そこを貫く普遍性が密やかに、しかし確かに意識化されていく世界をプロジェクトは夢見る。



8.採択理由


 
極めて斬新な提案である。言葉の音韻情報をもとに、世界の言語的・音響的リンクをたどっていく新たな空間を構築しようとしている。デジタル・アートとしての新分野を築く可能性のある提案である。



9.開発目標


 本提案では、異言語間の偶然的音声連鎖によって世界を探索するプロジェクト「Project Phonethica」の基幹となるシステム「Phonethica System」を開発する。

 Phonethica Systemは、世界言語データベース(Phonethica Database)、音声近似比較アルゴリズム(Phonethica Process)、グラフィックユーザーインターフェース(Phonethica Desktop)で構成され、世界のあらゆる言語の間を飛び越え、音声的に近似の言葉を探し出す。探し出された言葉は同時にそれぞれの背景情報と結びづけられ、ユーザーは音声の偶然の一致をきっかけに、これまで知らなかった様々な情報を体験する。



10.進捗概要


 上記「Phonethica System」の実装を完了した。



11.成果


 以下に開発内容を説明する。

 

 

 A. 世界言語データベース/Phonethica Database(以下DBともいう)

 A-1. フリー辞書の収集
 インターネット上で展開されているライセンスフリーの世界言語辞典プロジェクトから,Phonethicaで参照可能なIPA付きの辞書を収集した。当該サイトに登録されている世界の様々な言語辞典から、IPAが添付されていることを確認できたのは以下の辞書群である。

  French -> English / French -> Netherlands / French -> German
  German -> English
  English -> French, Irish, Latin, Dutch, Romanian, Russian, Spanish, Swedish, Welsh, German
  Dutch -> English, German, French,

 A-2. フリー辞書からのデータ抽出スクリプト
 上記の方法により収集した辞典から、スペル、発音記号、意味の三項目を抽出するスクリプトを開発、実装した。抽出されたデータはSQLiteのデータベースに納めた。

 A-3. IPA付加スクリプト
 ローマ字表記された日本語の辞典に、IPAを自動的に付加するスクリプトを開発し、実装した。ローマ字とIPAの対応については、三省堂「言語学大事典」を参考にした。

 A-4. Phonethica Manager
 単語・言語・背景情報の入力及び管理を行うソフトウェアを開発し、実装した。

 A-5. DB構造設計
 SQLiteをベースに、Mac OS XのCoreData2の仕組みを使って、言語情報のみならず、その背景情報(例えばその言語が話されている国々の地理的な情報など)も参照可能なDBの構造設計を行い、実装した。



 

 A-6. 単語入力
 三省堂の許諾を得て、「世界のことば100語辞典ヨーロッパ編・アジア編」から、ハンガリー語、ポーランド語、韓国語、アラビア語、ロシア語、イタリア語、ノルウェー語、アイヌ語の各データをマニュアル入力した。



 B. 音声近似比較アルゴリズム/Phonethica Process
 音声近似の比較については、それぞれの単語に付随するIPAの近似値計算を行うソフトウェアを実装した。

 

 

 
 近似の比較には音声認識に広く用いられているDPマッチングのアルゴリズムを利用した。通常、音声認識では、音声データから特徴量を抽出しDB内のサンプルデータとの比較を行う。本システムでは、サンプルがIPAデータのみのため、各IPA記号間の相対的な距離を定義することでDPマッチングの計算を行った。

 
 また、より音韻論的3な(ざっくりとした)比較を実現するために、子音と母音をひとまとまりにした上で近似値を測るアルゴリムも併せて開発・実装した。さらに、開発当初は検索毎に行っていた近似値計算をまとめて高速に行うソフトウェアも開発した。計算された単語間の類似度のデータはDBに格納される。このことにより、検索スピードの向上を実現し、また、今後のDBの拡充にも対応した。

 

 C. グラフィックユーザーインターフェース/Phonethica Desktop

 Phonethica Database及びPhonethica Processを利用するためのグラフィックユーザーインターフェースを開発・実装した。



 開発当初は、OpenGLのヴィジュアルプログラミング環境(Quarz Composer)を使ってインターフェースデザインを行ったが、このプログラミング環境を取り巻く状況が当初の期待に反して盛り上がらず、また、インタラクティヴィティ等についても今後の拡張性がさほど望めないと判断し、これを中止した。その後はMac OS XのグラフィックAPI Quartzを直接利用する形でインタフェースの開発を行った。その際、当プロジェクト共同開発者の徳井直生が2004年前期未踏ソフトウェア創造事業で開発を行った[Fluido]のソースコードを参考にした。

 以下に実際の利用の流れを簡単に説明する。

 ユーザが適当な単語のスペル/意味(の一部)を入力すると、ヒットした単語が画面左のリストに表示される。 さらに、リスト内の単語をクリックすると、右のメイン画面にグラフィカルな表現が現れる。グラフィック表示には次の二つのモードがある。

 
ネットワークモード
 ユーザが選択した単語を中心とし、類似の単語をネットワーク上に表現したモード。各単語は、画面上に浮かぶオブジェクトとして表現され、相互の関係に応じてダイナミックかつシームレスに位置関係を変えていく。ユーザはダブルクリックによって次に中心となる単語を選択することで、単語間の類似のネットワークの中をスムーズに探索することができる。

 

 

 
地理情報モード
 世界地図を使って音声的に類似する単語の地理上の分布を表現したモード。ユーザが選択した単語とその類似の単語を、その単語が属する言語の発祥地の上に表示する。同時に、その言語が現在話されている地域と各地域の大まかな人口が地図上に表示される。

 

 
 二つのモードはツールバー上の切り替えボタンをクリックすることでスムーズに切り替えられる。いずれのモードにおいても、表示されている単語上にマウスを置くことで、詳細情報がポップアップバルーンとして表示されるとともに、IPA記号をもとに合成した発音を聞くことができる。この音声合成にはAcapela Group社の開発したIPA表記対応のText to Speech SDKを利用した。詳細情報中の単語の意味は、オンライン辞書を利用して検索された単語の意味をユーザが選択した言語に自動的に変換する仕組みを構築した。

 さらに、検索された単語に対応した画像をインターネットから検索し、単語の綴りとともにリアルタイムに表示する仕組みを実装した。これによって、より直感的かつ即時的な表示が可能になった。


 なお、開発者は本事業の当初より国内外の学会や展覧会で積極的に発表を行うことで、プロジェクトの達成に不可欠な国際的なネットワークを形成することを試みており、ここまでにEUのMapXXL(www.art4eu.net/en/programmes/mapxxl)、UNESCOの Aschberg Bursaries for Artists Programme( www.unesco.org/culture/aschberg)等のプログラムにも採択されている。




12.プロジェクト評価


 本プロジェクトの動機は、絶滅危惧言語の収集など文化的に深い洞察から始まり、それをメディア・アートの形態で再構成した非常にオリジナリティーの高いものである。いろいろな困難を伴った開発であるが、おおむね順調に推移し、今後の発展が期待できる段階に到達している。この意味で、今回のIPAでのプロジェクトは、成功裏に完了したと評価できる。
 ただし、このプロジェクトは、今後も継続的な開発と支援が必要であり、それをどのようにアピールし確保するかが、重要な課題である。現段階では、広く一般にこのプロジェクトの面白さと重要性を認識させる段階の一歩手前の段階であり、次のステップを新たな切り口から構想し、大きなムーブメントへと展開する仕掛けが必要である。



13.今後の課題


 開発中に直面した問題と、その解決方法について、以下に説明する。

 (1)言語データの圧倒的な不足
 世界規模で拡大するデジタルデバイト(情報格差)を象徴するかのように、Phonethicaアプリケーションの要求する条件(著作権フリーのデジタルデータであり且つ国際音声記号を保持している辞典)を満たす中規模以下の言語辞典を見つけることがほとんど出来なかった。

 解決方法
 プロジェクトのウェブサイト(www.phonethica.net)を立ち上げ、世界中の人々がそれぞれの言葉をアップロードできる仕組みを開発し、これを実装する。

 (2)音声近似値比較アルゴリズムの精度向上の限界
 対応言語の種類が増えれば増えるほど、音声近似値比較アルゴリズムの精度が落ちる。これは、一つ一つの言語がその発音法則に多くの例外を持っているからであり、今後さらに言語の種類が増えていくことを鑑みると、このままトライアンドエラー方式でパラメータを調整しつづけていくのにはおのずと限界がある。

 解決方法
 プロジェクトのウェブサイトにおいて、検索の結果に対しユーザーが投票できる仕組みを実装する。「似てる」と判断された単語同士の関係にはポイントが付加され、「似てない」と判断された関係からはポイントが減ぜられる仕組みをつくることで、従来の音声近似比較アルゴリムに格段の進歩を期待できる。


 今後の展望
 上に示したように、開発に際して問題となった案件については、ウェブサイトを適切に開発・運用することで解決の見通しがたった。今後は、国際的なヒューマンネットワークを構築しながら言語及びその背景情報の充実を図ると共に、プロジェクト全体としては美術館等でのインスタレーションやプレゼンテーションを積極的に行うほか、将来的には国際宇宙ステーションにおけるエンタテインメントアプリケーションとして発展させることも見据えている。


  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004