|
 
(1) 情報集積システム
(1)-1 Phonethica
DB(言語データベース)のオ
ンライン化(図1)
開発環境:Ruby on Rails/My SQL
実装内容:スタンドアローンアプリケーションと
して作動していた従来のPhonethica DBの
オンライン化については,移植スクリプトを記述し,
データ間の関係を保ったままに移植を行った.
その際,従来のDBにはなかった「Tags」と
「Sound」という新規項目については「データ未入力」
という情報を付加した.また,従来のPhonethica
Processの持つアルゴリズミックで音声学的な
近似値と,(3)で後述するPhonethica Voteに
よるユーザーから投票された値の集積としての
音韻論的な近似値とのマッチングを取る際には,
Phonethica
Voteから導かれる近似値を優先する
こととしたが,通常のSQL文では処理が遅すぎ
到底使用に耐えないため,チューニングを施し,最適化を図った.
(1)-2 単語投稿機能
開発環境:Mac OS/Ruby on Rails/My
SQL/Adobe
Flash Professional/Adobe
Flash
Player/Adobe Photoshop/Adobe
Illustrator/Adobe
Dreamweaver/Apple Safari 2.0
実装内容:単語の投稿に際しては,事前にユーザー
登録もしくはログインが必要であるため,まず,
ユーザー登録及びログインの遷移について説明し,
続いて単語投稿の遷移について説明する.
ユーザー登録の遷移
新規ユーザーは《Login Page(図2)》において任意のユーザーID
とパスワードを入力し[Resister for account]をクリックすること
で《Signup Page(図3)》に遷移する.《Signup Page》では[name],
[login(User
Name)], [email],「password」の各項目に必要事項を
入力したのち【Signup】ボタンを押すことで,本人確認認証メール
が入力したメールアドレスに送られる(図4).認証はユーザーが
本人確認認証メールに記載のURLをクリックすることにより完了し,
ユーザーアカウントが発行される(図5).ログインしたユーザーは
[edit
profile/delete account]をクリックし《Edit User Page(図6)》
にてプロファイル設定を行う.
単語投稿の遷移
単語投稿の遷移には,(3)に後述するPhonethica Viewer上での
検索において検索単語がDBに見つからなかった場合と,同じく
(3)に後述する「Information
Popup Window」から音声的に似て
いる単語を能動的に追加する場合との,2通りの遷移がある.
ここでは,この2つのケースから到達する《New Word Page
(図7)》以降の手順について以下に説明する.
《New Word Page》では,[Spelling(綴り)], [Roman(ローマ字
表記)], [Phonetic Symbol(発音記号)], [Locale -
Language
and
Country (話者地域)], [Tags(タグ)]の各項目に任意の
事項を入力したのち,【next】ボタンをクリックし,《Edit Word
Page(図8)》へと遷移する.《Edit Word Page》では,上記5項目
に加えて,[Meaning(意味)+言語名],
[Sound(音声)]の2項目
について当該事項を入力(Soundの場合は当該ファイルを選択
するか,Window最下部のUploaderに直接録音する)し,【Apply】
ボタンをクリックすることで《Word Details Page(図9)》へと遷移する.
ここでは,投稿した単語がPhonethica DBに格納された事を確認
することができる.
 (2) 情報処理システム - Phonethica
Process
開発環境:音声比較機能はMATHWORKS MATLAB(図10)
の上に実装した.MATLAB上からのDBの読み書きには,
MYMライブラリを利用した.開発にはMac OSを使用したが,
MATLABに対応した環境であれば,OSを問わず動作する
(Mac
OS, Linux, Windows).また,MATLABでの類似度計算
の前処理として,FLVフォーマットで録音された音声ファイル
をMATLABで扱えるMP3ファイルに変換するシステムを
Windows上に構築した.
実装内容:音声比較機能
従来のPhonethica Processが発音記号列の比較をベースにしていたのに対し.本開発では,実際の音声をベースにした音声比較機能を実装した.その際,任意の2つ
の音声ファイルを比較し,その類似度を算出する.人によって当然声の高さが異なるので,単純に音声のスペクトルなどを比較しただけでは単語の発音の類似度
を算出することはできない.一般に発音の同定は,声道の特性の影響が大きいとされている.そこで,音声認識等で広く用いられる線形予測法と呼ばれる方法
で,声道をデジタルフィルタとしてモデリングする.推定される声道のフィルタ係数 (線形予測係数 LPC) を,単語間で比較することで発音の類似度を算出する.以下,処理のフェーズごとに簡潔に説明する.
(2)-1 前処理
それぞれの音声ファイルについてノイズリダクション (音声ファイルの先頭の無音時のスペクトル成分から推定されるノイズ成分を,全体から引くことによって実現)の後,高周波成分を持ち上げるフィルタをかけることで子音を区別しやすくする.
(2)-2 フィルタ特性の推定
窓関数をかけて分割した,音声サンプルに対して,Levinson-Durbinのアルゴリズムを適用し,LPCを推定する.
(2)-3 フィルタ特性の比較
得られたLPCを二つの単語間で比較する.動的計画法(Dynamic
Programming)によるマッチング,DPマッチングによって発音のスピードの差などを吸収し,類似度が計算できる.
(2)-4 後処理
適当な閾値を設け,類似度を正規化し,DBに格納する.
FLVの変換
FLVの変換FLVの音声コーデックnellymoserはライセンスフィーが高額で,デコードが大変難しい.そこで唯一市販されているnellymoserデコーダー,Moyea FLV to Video
Converterを利用することとした.しかし,FLV to Video Converterは,通常のGUIソフトウェアのため,サーバ上で利用することが難しい.そこで,Windows上のスクリプティング環境UWSCによって,マウスの操作を動化する仕組みを構築した.これによって特定のディレクトリを常に監視し,Flash Media Serverで録音された新しいファイルがあると自動的にMP3に変換して出力することが可能になった.
(3) 情報表現システム
開発環境:Mac OS/Adobe Flash
Professional/Adobe Flash Player/Adobe Photoshop/Adobe Illustrator/Adobe
Dreamweaver/Apple Safari
実装内容:Phonethica Viewer
2005年度未踏事業案件として開発した「Phonethica Desktop」を「 Phonethica Viewer(図11)」としてオンライン上に発展的に再構築した.以下に各部分について以下に説明する.

同音語検索
《Phonethica Viewer》を開くと,画面左下部に【Search】ボタンが現れる.【Search】ボタンをクリックすると,検索コラムと検索結果を示すテーブルが現れ(図12),ユーザーは任意のコトバをコラムに入力することで,Phonethica DBを検索する.検索テーブルには前方一致で検索された単語の一覧表示され,ユーザーはその中から任意の単語をクリックする.
セル
クリックされた単語は,セルとして画面中央に表示され,
続いて,その単語と近似の音声を持つ単語群がその
周囲を取り囲む(図11).周囲のセル群の中から任意の
セルをクリックすれば,今度はそのセルが中央に表示され,
続いてその単語と近似の音声を持つ単語群がその周囲を
取り囲む.
中央のセルには,その単語の保持するタグ情報を検索
ワードとして取得されたFlickr上の画像がセルを取り
囲むように配置される.それぞれの画像をクリックすると,
新規ウィンドウが開き,Flickr上の当該画像を閲覧する
ことが出来る(図13).このことにより,単語を直接の
検索ワードとするよりも多彩な画像を取得することが
可能になり.ユーザーはその単語を,その単語を取り
囲む文化と共に多層的に閲覧することができる.
また,セル右側にはその単語の音声を聞くことの
できる【Speech】ボタンと,その単語の詳細情報を参照
するための【Info】ボタンが配置されている.【Info】
ボタンをクリックすることでポップアップする「Information
Popup
Window(図14)」には,以下の各情報が表示される.
単語の意味/言語名/発音記号/タグ/Googleへのリンク
(当該単語を検索)/Wikipediaへのリンク(当該単語を検索)
/【Edit】ボタン(当該単語の関連情報編集画面に遷移)/
【Add】ボタン(当該単語に音声近似の単語を追加する.
《New Word Page》に遷移)/【Close】ボタン
Phonethica Vote(音声的近似度への投票機能)
中央のセルと周囲のセルとを結ぶライン上には【Vote】ボタンが配置され,ユーザーはその2つの単語の音声的近似度に対し投票することがきる.【Vote】ボタンをクリックすることで表示される「Voting Popup
Window(図15)」上に示された「Very
Similar/Similar/Not So Similar」の3段階の選択肢の中から適当と思われるものを1つ選択することで,その値がDBの保持する近似値情報にリアルタイムで反映される.
なお,この近似度合はセルとセルとを繋ぐラインの太さと濃度によってヴィジュアライズ(図16)されており,ユーザーはそのつながりの濃淡を直感的に体験することができる.
(4) Phonethica Installation
Rondoとの連携
2005年度未踏事業開発案件の成果としてNTT ICC - Inter Communication Center (東京・初台)に展示中(2006年6月〜2007年3月)の
Phonethica Installation Rondo(図17)のアップデートを定期的に行い,本プロジェクトとの連携を図った.具体的には,下記の項目について,実装を行った.
スクリーンキーボードの実現(図18)/プロジェクト情報の表示(図19)/インターフェースデザインの精緻化 / システム全体の安定化/2005年度未踏事業開発案件「Phonethica Desktop」のリリース

(5) 各種研究機関との交渉業務
2006年10月23日〜28日 北京で開催されたMusicacoustica
2006 and Electroacoustic Music Studies Network(EMS) 2006にてプロジェクトの発表を行った.その他,2006年7月から2007年2月までの間に以下の団体/研究機関とEmail及び書簡にて継続的な交渉業務を行った.
ブレゲンツ美術館企画部(オーストリア)/アルケン美術館企画部(デンマーク)バルセロナ現代美術館企画室(スペイン)/フロニンゲン美術館(オランダ)/ストックホルム現代美術館調査研究部(スウェーデン)/サンフランシスコ近代美術館企画室(米国)/EYEBEAM(米国)アイルランド現代美術館企画部(アイルランド)/ポンピドーセンター(フランス)/ZKM調査研究部(ドイツ)/CIANT企画部(チェコ)/アイコンギャラリー企画室(英国)/レイキャビク美術館企画室(アイスランド)/アルゴス企画運営部(ベルギー)
さらに,今後もプロジェクトを継続的に展開するために,東京都に対し特定非営利活動法人NPO Phonethica 認証申請を行った(2006年12月12日申請).
|