IPA


開発成果一覧へ

 



2006年度上期 未踏ソフトウェア創造事業  採択案件評価書

 


1.担当PM

   北野 宏明  (株式会社ソニーコンピュータサイエンス研究所 取締役副所長)


2.採択者氏名

開発代表者

遠藤 拓己 (フリーランス)

共同開発者

なし


3.プロジェクト管理組織


   財団法人国際メディア研究財団


4.委託金支払額


  9,999,719


5.テーマ名


 Phonethica -Serendipity Enhancer- 異言語間の偶然的音声連鎖で世界を探索するシステム

 


6.関連Webサイト


  http://www.phonethica.net/


7.テーマ概要

 2006年現在,6000種とも7000種ともいわれる地球上の言語のうちの,50%から90%が今世紀中にも消滅するという. Project Phonethicaは, 私たち人類の言語の,特にその音声的な特質を媒介に世界の多様性を探り,その成果を芸術の魔力と科学テクノロジーによってダイナミックに散種することで, 断片化の末の混沌を謳歌する現代社会を生き抜けていくための実践的な方法を探しだすことを目的とするプロジェクトである.
 
2004
年以降,東京,パリ,ベルリンといった世界の主要都市を舞台に展開されているこの学際的アートプロジェクトは,2005年度の未踏ソフトウェア創造事業に採択された.そこでは,プロジェクトの核となる,世界のあらゆる言語の間を飛び越え,音声的に近似の言葉を探し出すことのできるコンピューティングシステム「Phonethica System」の研究開発を行った.
 
本提案では,その開発の過程で明らかになった問題点(デジタル化された言語データの偏りなど)を解決するため,現在スタンドアローンアプリケーションである上記PhonethicaSystemを拡張し,ユーザー参加型のウェブシステムを新たに構築する.全世界のユーザーから集められた大規模な言語データと現行のアプリケーションとをシームレスに統合することで,プロジェクトに立ちはだかる諸問題をその根本から解決しようとする試みである.
 
同 時に,プロジェクトを継続的に展開していくために必要な各種事業モデルを大胆に発案し,実証的な実験を経てシステムの一部として実装することを提案する. 具体的には,商品のネーミングあるいは子供の名付けのための発想支援システム,語学学習における暗記の支援システムなどである.
 
Project Phonethica
は,意味の連鎖によって均質化へとひた走る世界に,偶然の連鎖によってオルタナティブな価値の可能性を提示し,それを市井の中に確率的に散種することで,世界の力学を変容しようとするプロジェクトである.


8.採択理由


 Phonethicaは、二回目の採択である。今回は、前回の成果をベースに、分散的にデータを入力できるシステムを開発し、WEB上に公開し、絶滅言語の保全を志向することで、文化的多様性を救っていく、または記憶にとどめることを具体的に打ち出している。今回の二件の採択は、Save GAIAを共通テーマとして、文化多様性の保護と地球環境の保護に関するものとした。Phonethicaは、今回の採択でプロジェクトの仕上げとして、人類の文化的多様性の保全・記録の世界的ムーブメントを起こしてほしい。

 


9.開発目標


私たちの世界には現在,5000種とも6000種ともいわれる数の言語が存在している.1992年,アメリカの言語学者マイケル・クラウスは,世界の言語のうちの50%から90%が,向こう100年の間に消滅するだろうという衝撃的な報告を行った.また,UNESCO2003年にタイにおいて開催した世界言語に関する国際会議の報告によると,世界の言語のうちの50%,約3000種の言語はもう世界中どこの小学校でも教えられておらず,すでに瀕死の状態にあるという.さらに同報告は,世界の言語の約40%にあたる約2400種 の言語については,私たちの子供の世代を超えることなく消滅するだろうと警告している.このように,私たちの言語は危機に瀕している.これは,私たちの多 様性の危機だと言い換えることもできる.しかし一方で,言語が統合されていくのは必ずしも悪いことではないようにも思える.言語の統合は例えば民族間の緊 張を和らげるだろうし,世界的な経済活動にとっても有益である.歴史を振り返ってみても,少数派の共同体に属する人々が自分たちの言葉を捨て多数派の言語 に切り替え,それによって社会的・経済的な地位の向上を獲得しようとする,ということが何度も起こっている.しかしそれでもなお,少なからぬ人々がこの世 界の言語の消滅という事実を嘆かわしい事だと捉えている.例えばそこには純粋に科学的,学術的な関心に基づいた喪失感がある.言語研究が扱うもっとも基本 的な問題のいくつかは,人間の言語の構造や規則性にはどのようなものがありうるのか,という私たちの精神構造についての謎に関連している.しかし現在に至 るまで,この謎が解明されているとは到底言えない.そしてその謎を解明するための学術的な調査対象としての言語の数は,端的に言って,多ければ多いほどい い.あるいはこの喪失感を,私たちのエゴイスティックな欲望の発露として考えることも出来る.つまり,私たちが私たちの多様性を何かしら良きものとして感 じるのは,それが人類の繁栄にとって優位であるからだ,という考え方である.仮に私たちがかようなまでに多様に分岐せずに,単なる同じもののコピーである としたら,私たちはたった一つの病気や,たった一度の小さな気候の変化によって簡単に絶滅してしまうだろう.このような壊滅的な状況を回避するための戦略 として多様性という現象を捉えれば,私たちがそこにいくばかの尊さを感じるのは,それがつまりは私たちの繁栄を担保してくれているからである,ということ で一応の合理的説明がつくだろう.しかし概して事情はより単純な図式の中で理解される.すなわち,マイナーな言語の喪失とはつまりメジャーな言語による代 替を意味するため,人々はそこに,一般にグローバライゼーションという言葉が想起させる流動的で均一的な世界の有りように対する反感や徒労感を感じる.さ らに,このようなネガティブな感覚は,人々の間で共有されることによってある種の満足感へと転化し,やがて,世界はけだるさに覆い尽くされる.

 

Project Phonethicaは,意味の連鎖によって均質化へとひた走る世界に,偶然の連鎖によってオルタナティブな価値の可能性を提示し,それを市井の中に確率的に散種することで,世界の力学を変容することを目的とする.

 


10.進捗概要


(1) 情報集積システム

目標:   Phonethica DBのオンライン化,言語アップロードシステムの仕様策定と実装.

結果:  Phonethica DBのオンライン化,言語アップロードシステム(以降「単語投稿   機能」という)の実装について,ともに完了した.

 

(2) 情報処理システム

目標:   Phonethica Processのオンライン化,投票システムの実装,音声認識機能の仕様   策定と実装.

結果:  Phonethica Processのオンライン化,投票システム, 音声認識機能(以降「音声比較機能」という) の実装について,すべてに完了した.

 

(3) 情報表現システム

目標:   Phonethica Desktopのオンライン化,人々の参加意識を高める様々なアートワーク仕様策定と実装.

結果:   Phonethica Desktopのオンライン化について,完了した.人々の参加意識を高める様々なアートワーク

の実装については,単語に付随する様々なタグによるFlickrからの画像自動取得機能,単語に関連す

る情報をWikipedia,及びGoogleから検索する仕組みを実装した.

 

(4) Phonethica Installation Rondoとの連携

目標:   2005年度未踏事業開発案件の成果としてNTT ICC - InterCommunication Center (東京・初台)に展

     示中(20066月〜20073月)の Phonethica Installation Rondoと本プロジェクトの連携を図り, 

システム仕様を策定し実装する.

結果:   Phonethica Installation Rondoのシステムアップデートを定期的に行い,本プロジェクトとの連携を図っ

た.また, これに関連して,2005年度未踏事業開発案件「Phonethica Desktop」のリリースを行った.

 

(5) 各種研究機関との交渉業務

目標: 情報集積システムPhonethica DBの充実を推進するための研究機関,出版社,美術館などとの交渉業

          務(国内・国外).

結果:   北京で開催されたMusicacoustica 2006 and Electroacoustic Music Studies Network(EMS) 2006

     てプロジェクトの発表を行った.その他,各種研究機関と継続的な交渉業務を行った.また,今後もプロ

ジェクトを継続的に展開するために,東京都に対し特定非営利活動法人NPO Phonethica認証申請を

行った.

 


11.成果

(1) 情報集積システム

(1)-1 Phonethica DB(言語データベース)のオ

ンライン化(図1

開発環境:Ruby on Rails/My SQL

 

 

実装内容:スタンドアローンアプリケーションと

して作動していた従来のPhonethica DB

オンライン化については,移植スクリプトを記述し,

データ間の関係を保ったままに移植を行った.

その際,従来のDBにはなかった「Tags」と

Sound」という新規項目については「データ未入力」

という情報を付加した.また,従来のPhonethica

Processの持つアルゴリズミックで音声学的な

近似値と,(3)で後述するPhonethica Vote

よるユーザーから投票された値の集積としての

音韻論的な近似値とのマッチングを取る際には,

Phonethica Voteから導かれる近似値を優先する

こととしたが,通常のSQL文では処理が遅すぎ

到底使用に耐えないため,チューニングを施し,最適化を図った.

 

(1)-2 単語投稿機能

開発環境:Mac OS/Ruby on Rails/My

SQL/Adobe Flash Professional/Adobe

Flash Player/Adobe Photoshop/Adobe

 Illustrator/Adobe Dreamweaver/Apple Safari 2.0

実装内容:単語の投稿に際しては,事前にユーザー

登録もしくはログインが必要であるため,まず,

ユーザー登録及びログインの遷移について説明し, 続いて単語投稿の遷移について説明する.

 

ユーザー登録の遷移

新規ユーザーは《Login Page(図2)》において任意のユーザーID

とパスワードを入力し[Resister for account]をクリックすること

で《Signup Page(図3)》に遷移する.《Signup Page》では[name],

[login(User Name)], [email],password」の各項目に必要事項を

入力したのち【Signup】ボタンを押すことで,本人確認認証メール

が入力したメールアドレスに送られる(図4).認証はユーザーが

本人確認認証メールに記載のURLをクリックすることにより完了し,

ユーザーアカウントが発行される(図5).ログインしたユーザーは

[edit profile/delete account]をクリックし《Edit  User Page(図6)》

にてプロファイル設定を行う.

 

単語投稿の遷移

単語投稿の遷移には,(3)に後述するPhonethica Viewer上での

検索において検索単語がDBに見つからなかった場合と,同じく

(3)に後述する「Information Popup Window」から音声的に似て

いる単語を能動的に追加する場合との,2通りの遷移がある.

ここでは,この2つのケースから到達する《New Word Page

(図7)》以降の手順について以下に説明する.

 

New Word Page》では,[Spelling(綴り)], [Roman(ローマ字

表記)], [Phonetic Symbol(発音記号)], [Locale - Language

and Country (話者地域)], [Tags(タグ)]の各項目に任意の

事項を入力したのち,【next】ボタンをクリックし,《Edit Word

Page(図8)》へと遷移する.《Edit Word Page》では,上記5項目

に加えて,[Meaning(意味)+言語名], [Sound(音声)]2項目

について当該事項を入力(Soundの場合は当該ファイルを選択

するか,Window最下部のUploaderに直接録音する)し,【Apply

ボタンをクリックすることで《Word Details Page(図9)》へと遷移する.

ここでは,投稿した単語がPhonethica DBに格納された事を確認

することができる.

 

  

 


(2) 情報処理システム - Phonethica Process

開発環境:音声比較機能はMATHWORKS MATLAB(図10

の上に実装した.MATLAB上からのDBの読み書きには,

MYMライブラリを利用した.開発にはMac OSを使用したが,

MATLABに対応した環境であれば,OSを問わず動作する

(Mac OS, Linux, Windows).また,MATLABでの類似度計算

の前処理として,FLVフォーマットで録音された音声ファイル

MATLABで扱えるMP3ファイルに変換するシステムを

Windows上に構築した.

 

実装内容:音声比較機能

従来のPhonethica Processが発音記号列の比較をベースにしていたのに対し.本開発では,実際の音声をベースにした音声比較機能を実装した.その際,任意の2つ の音声ファイルを比較し,その類似度を算出する.人によって当然声の高さが異なるので,単純に音声のスペクトルなどを比較しただけでは単語の発音の類似度 を算出することはできない.一般に発音の同定は,声道の特性の影響が大きいとされている.そこで,音声認識等で広く用いられる線形予測法と呼ばれる方法 で,声道をデジタルフィルタとしてモデリングする.推定される声道のフィルタ係数 (線形予測係数 LPC) を,単語間で比較することで発音の類似度を算出する.以下,処理のフェーズごとに簡潔に説明する.

 

(2)-1 前処理

それぞれの音声ファイルについてノイズリダクション (音声ファイルの先頭の無音時のスペクトル成分から推定されるノイズ成分を,全体から引くことによって実現)の後,高周波成分を持ち上げるフィルタをかけることで子音を区別しやすくする.

 

(2)-2 フィルタ特性の推定

窓関数をかけて分割した,音声サンプルに対して,Levinson-Durbinのアルゴリズムを適用し,LPCを推定する.

 

(2)-3 フィルタ特性の比較

得られたLPCを二つの単語間で比較する.動的計画法(Dynamic Programming)によるマッチング,DPマッチングによって発音のスピードの差などを吸収し,類似度が計算できる.

 

(2)-4 後処理

適当な閾値を設け,類似度を正規化し,DBに格納する.

 

FLVの変換

FLVの変換FLVの音声コーデックnellymoserはライセンスフィーが高額で,デコードが大変難しい.そこで唯一市販されているnellymoserデコーダー,Moyea FLV to Video Converterを利用することとした.しかし,FLV to Video Converterは,通常のGUIソフトウェアのため,サーバ上で利用することが難しい.そこで,Windows上のスクリプティング環境UWSCによって,マウスの操作を動化する仕組みを構築した.これによって特定のディレクトリを常に監視し,Flash Media Serverで録音された新しいファイルがあると自動的にMP3に変換して出力することが可能になった.

 

(3) 情報表現システム

開発環境:Mac OS/Adobe Flash Professional/Adobe Flash Player/Adobe Photoshop/Adobe Illustrator/Adobe Dreamweaver/Apple Safari

 

実装内容:Phonethica Viewer

2005年度未踏事業案件として開発した「Phonethica Desktop」を「 Phonethica Viewer(図11)」としてオンライン上に発展的に再構築した.以下に各部分について以下に説明する.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


同音語検索

Phonethica Viewer》を開くと,画面左下部に【Search】ボタンが現れる.【Search】ボタンをクリックすると,検索コラムと検索結果を示すテーブルが現れ(図12),ユーザーは任意のコトバをコラムに入力することで,Phonethica DBを検索する.検索テーブルには前方一致で検索された単語の一覧表示され,ユーザーはその中から任意の単語をクリックする.

 

 

セル

クリックされた単語は,セルとして画面中央に表示され,

続いて,その単語と近似の音声を持つ単語群がその

周囲を取り囲む(図11).周囲のセル群の中から任意の

セルをクリックすれば,今度はそのセルが中央に表示され,

続いてその単語と近似の音声を持つ単語群がその周囲を

取り囲む.

 

 

 

中央のセルには,その単語の保持するタグ情報を検索

ワードとして取得されたFlickr上の画像がセルを取り

囲むように配置される.それぞれの画像をクリックすると,

新規ウィンドウが開き,Flickr上の当該画像を閲覧する

ことが出来る(図13).このことにより,単語を直接の

検索ワードとするよりも多彩な画像を取得することが

可能になり.ユーザーはその単語を,その単語を取り

囲む文化と共に多層的に閲覧することができる.

また,セル右側にはその単語の音声を聞くことの

できる【Speech】ボタンと,その単語の詳細情報を参照

するための【Info】ボタンが配置されている.【Info

ボタンをクリックすることでポップアップする「Information

 Popup Window(図14)」には,以下の各情報が表示される.

 

 

 

 

単語の意味/言語名/発音記号/タグ/Googleへのリンク

(当該単語を検索)/Wikipediaへのリンク(当該単語を検索)

/Edit】ボタン(当該単語の関連情報編集画面に遷移)/

Add】ボタン(当該単語に音声近似の単語を追加する.

New Word Page》に遷移)/Close】ボタン

 

 

 

 

 

 

 

Phonethica Vote(音声的近似度への投票機能)

中央のセルと周囲のセルとを結ぶライン上には【Vote】ボタンが配置され,ユーザーはその2つの単語の音声的近似度に対し投票することがきる.【Vote】ボタンをクリックすることで表示される「Voting Popup Window(図15)」上に示された「Very Similar/Similar/Not So Similar」の3段階の選択肢の中から適当と思われるものを1つ選択することで,その値がDBの保持する近似値情報にリアルタイムで反映される. なお,この近似度合はセルとセルとを繋ぐラインの太さと濃度によってヴィジュアライズ(図16)されており,ユーザーはそのつながりの濃淡を直感的に体験することができる.

 

(4) Phonethica Installation Rondoとの連携

2005年度未踏事業開発案件の成果としてNTT ICC - Inter Communication Center (東京・初台)に展示中(20066月〜20073月)の Phonethica Installation Rondo(図17)のアップデートを定期的に行い,本プロジェクトとの連携を図った.具体的には,下記の項目について,実装を行った.

 

スクリーンキーボードの実現(図18/プロジェクト情報の表示(図19/インターフェースデザインの精緻化 / システム全体の安定化/2005年度未踏事業開発案件「Phonethica Desktop」のリリース



(5) 各種研究機関との交渉業務

20061023日〜28日 北京で開催されたMusicacoustica 2006 and Electroacoustic Music Studies Network(EMS) 2006にてプロジェクトの発表を行った.その他,20067月から20072月までの間に以下の団体/研究機関とEmail及び書簡にて継続的な交渉業務を行った.

 

ブレゲンツ美術館企画部(オーストリア)/アルケン美術館企画部(デンマーク)バルセロナ現代美術館企画室(スペイン)/フロニンゲン美術館(オランダ)/ストックホルム現代美術館調査研究部(スウェーデン)/サンフランシスコ近代美術館企画室(米国)/EYEBEAM(米国)アイルランド現代美術館企画部(アイルランド)/ポンピドーセンター(フランス)/ZKM調査研究部(ドイツ)/CIANT企画部(チェコ)/アイコンギャラリー企画室(英国)/レイキャビク美術館企画室(アイスランド)/アルゴス企画運営部(ベルギー)

 

さらに,今後もプロジェクトを継続的に展開するために,東京都に対し特定非営利活動法人NPO Phonethica 認証申請を行った(20061212日申請).

 

 

 

 


12.プロジェクト評価


本プロジェクトの成果「Phonethica Web System」 は,世界のあらゆる言語の間を飛び越え,音の似ているコトバを探し出す.さらには,検索されたコトバの背景情報へのアクセスをついに実現した事により, ユーザーは,これまで知らなかった多種多様な情報を,偶然的且つダイナミックに体験することになる.かようなシステムが実用段階まで開発されたことはおそ らく地球上で初めてのことであり,この「Phonethica Web System」というアーキテクチャーは,以降,インターネットコミュニティとリアルワールドの間に散種される人類の知の集積のための新しいシステムとして自律的に運動しながら,様々なレベルで新たな研究領域を創出することになるだろう.

 

プ ロジェクトの成果はまた,国際的な視野を持つ人間教育のためのリソースとしても有益であるだろう.「一般に,国籍,身分,セクシャリティーといった,自ら のアイデンティティーに疑いを持たない人々は他者に対して鈍感で,それゆえ国際的な事象について実のある思考を展開することができない」(内田樹.2006).世界の様々な現象を多角的,包括的な視野から考察する態度は国際社会の市民として今後欠くことの出来ない能力となるはずであり,「Phonethica Web System」によるダイナミックな多様性の体験は,そのような能力を飛躍的に高めることができるだろう.

Phonethica Web System」は,一般に辞書で調べられるような異なる単語同士の意味の一致によるのではなく,たまたま偶然に近似の音を持つ単語を媒介にして,意味の連鎖によって均質化へとひた走る世界に,偶然の連鎖によってオルタナティブな価値の可能性を提示する.

 


13.今後の課題


本開発の成果により,プロジェクト開始当初からの目標であった「プロジェクトの市井の中への散種」の準備が整った.今後は,研究開発を引き続き鋭意進めることはもとより,「Phonethica Web System」を拠点に様々な立場の人々が積極的にプロジェクトにコントリビュートできる多層的なモチベーション,例えば知的な興奮,学術的な意義,参加意欲を高めるゲーム性,あるいは人道的に賛同可能な力強いメッセージ等を広く伝播することで世界に対する人々の意識を高め,「2週間に1つ」という現在の言語消滅の速度を少しでも緩和させることで人類の文化的多様性の保全及び持続可能な発展に積極的に寄与することとする.

 

なお,今後の具体的な数値目標として,以下の目標を設定した.

[短期指標]

20087月までに「Phonethica DB」がすでに保持する20万単語のすべてに音声情報を付加する.

20087月までに「Phonethica Web System」のユニークユーザー数30/月を実現する.

20087月までに「Phonethica News Letter」の購読者数7万人を実現する.

 

[中期指標]

現在10%UNESCO)に満たないWWWの多言語化に寄与し,2010年までにそれを20%にまで引き上げる.

世界最大の言語辞典である三省堂「言語学大辞典」の収録言語3,500言語のうち,現在も世界で用いられている約2000語についての音声データを,2010年までに例え1言語につき1語でもすべて「Phonethica DB」に収録する.

 

[長期指標]

西暦2100年の時点で4200種の言語が存在する,多様性に満ちた世界を実現する.

 

 

  ページトップへ   

 

 

 


  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004