| 
以下に開発内容を説明する。
A. 世界言語データベース/Phonethica
Database(以下DBともいう)
A-1. フリー辞書の収集
インターネット上で展開されているライセンスフリーの世界言語辞典プロジェクトから,Phonethicaで参照可能なIPA付きの辞書を収集した。当該サイトに登録されている世界の様々な言語辞典から、IPAが添付されていることを確認できたのは以下の辞書群である。
French -> English / French -> Netherlands / French ->
German
German -> English
English -> French, Irish, Latin, Dutch, Romanian, Russian,
Spanish, Swedish, Welsh, German
Dutch -> English, German, French,
A-2. フリー辞書からのデータ抽出スクリプト
上記の方法により収集した辞典から、スペル、発音記号、意味の三項目を抽出するスクリプトを開発、実装した。抽出されたデータはSQLiteのデータベースに納めた。
A-3. IPA付加スクリプト
ローマ字表記された日本語の辞典に、IPAを自動的に付加するスクリプトを開発し、実装した。ローマ字とIPAの対応については、三省堂「言語学大事典」を参考にした。
A-4. Phonethica Manager
単語・言語・背景情報の入力及び管理を行うソフトウェアを開発し、実装した。
A-5. DB構造設計
SQLiteをベースに、Mac OS XのCoreData2の仕組みを使って、言語情報のみならず、その背景情報(例えばその言語が話されている国々の地理的な情報など)も参照可能なDBの構造設計を行い、実装した。
A-6. 単語入力
三省堂の許諾を得て、「世界のことば100語辞典ヨーロッパ編・アジア編」から、ハンガリー語、ポーランド語、韓国語、アラビア語、ロシア語、イタリア語、ノルウェー語、アイヌ語の各データをマニュアル入力した。
B. 音声近似比較アルゴリズム/Phonethica Process
音声近似の比較については、それぞれの単語に付随するIPAの近似値計算を行うソフトウェアを実装した。
|
|
近似の比較には音声認識に広く用いられているDPマッチングのアルゴリズムを利用した。通常、音声認識では、音声データから特徴量を抽出しDB内のサンプルデータとの比較を行う。本システムでは、サンプルがIPAデータのみのため、各IPA記号間の相対的な距離を定義することでDPマッチングの計算を行った。
|
|
また、より音韻論的3な(ざっくりとした)比較を実現するために、子音と母音をひとまとまりにした上で近似値を測るアルゴリムも併せて開発・実装した。さらに、開発当初は検索毎に行っていた近似値計算をまとめて高速に行うソフトウェアも開発した。計算された単語間の類似度のデータはDBに格納される。このことにより、検索スピードの向上を実現し、また、今後のDBの拡充にも対応した。
|
|

|
C. グラフィックユーザーインターフェース/Phonethica
Desktop
Phonethica Database及びPhonethica Processを利用するためのグラフィックユーザーインターフェースを開発・実装した。
開発当初は、OpenGLのヴィジュアルプログラミング環境(Quarz Composer)を使ってインターフェースデザインを行ったが、このプログラミング環境を取り巻く状況が当初の期待に反して盛り上がらず、また、インタラクティヴィティ等についても今後の拡張性がさほど望めないと判断し、これを中止した。その後はMac
OS XのグラフィックAPI Quartzを直接利用する形でインタフェースの開発を行った。その際、当プロジェクト共同開発者の徳井直生が2004年前期未踏ソフトウェア創造事業で開発を行った[Fluido]のソースコードを参考にした。
以下に実際の利用の流れを簡単に説明する。
ユーザが適当な単語のスペル/意味(の一部)を入力すると、ヒットした単語が画面左のリストに表示される。
さらに、リスト内の単語をクリックすると、右のメイン画面にグラフィカルな表現が現れる。グラフィック表示には次の二つのモードがある。
|
ネットワークモード
ユーザが選択した単語を中心とし、類似の単語をネットワーク上に表現したモード。各単語は、画面上に浮かぶオブジェクトとして表現され、相互の関係に応じてダイナミックかつシームレスに位置関係を変えていく。ユーザはダブルクリックによって次に中心となる単語を選択することで、単語間の類似のネットワークの中をスムーズに探索することができる。
|
|

|
|
|
|
地理情報モード
世界地図を使って音声的に類似する単語の地理上の分布を表現したモード。ユーザが選択した単語とその類似の単語を、その単語が属する言語の発祥地の上に表示する。同時に、その言語が現在話されている地域と各地域の大まかな人口が地図上に表示される。
|
|
|
|
二つのモードはツールバー上の切り替えボタンをクリックすることでスムーズに切り替えられる。いずれのモードにおいても、表示されている単語上にマウスを置くことで、詳細情報がポップアップバルーンとして表示されるとともに、IPA記号をもとに合成した発音を聞くことができる。この音声合成にはAcapela
Group社の開発したIPA表記対応のText to Speech SDKを利用した。詳細情報中の単語の意味は、オンライン辞書を利用して検索された単語の意味をユーザが選択した言語に自動的に変換する仕組みを構築した。
|
さらに、検索された単語に対応した画像をインターネットから検索し、単語の綴りとともにリアルタイムに表示する仕組みを実装した。これによって、より直感的かつ即時的な表示が可能になった。
なお、開発者は本事業の当初より国内外の学会や展覧会で積極的に発表を行うことで、プロジェクトの達成に不可欠な国際的なネットワークを形成することを試みており、ここまでにEUのMapXXL(www.art4eu.net/en/programmes/mapxxl)、UNESCOの
Aschberg Bursaries for Artists Programme( www.unesco.org/culture/aschberg)等のプログラムにも採択されている。
|