IPA


開発成果一覧へ

 



2005年度下期 未踏ソフトウェア創造事業  採択案件評価書


 




1.担当PM

   原田 康徳 (NTTコミュニケーション科学基礎研究所 主任研究員)




2.採択者氏名

開発代表者

 竹林 暁  (東京大学大学院 総合文化研究科 言語情報科学専攻 博士課程) 

共同開発者

 なし  




3.プロジェクト管理組織


  有限会社 InfoArch




4.委託金支払額


 1,500,000




5.テーマ名


  Web上での言語地図共有フレームワークの構築




6.関連Webサイト


  なし




7.テーマ概要


 このプロジェクトでは、方言研究で使用される言語地図を共有するデータベースをWeb上で一般にサービスすることを試みます。言語地図とは、地方ごとの単語・発音・文法などの言語の差を地図で表したものです。すでに東京都言語調査研究会のために2002年からWeb言語地図を作成しており、それを拡張する形で実現させます。

 プロジェクトのねらいは二つあります。
 ひとつは、データベースの共有を通じて研究者の方々が互いの調査データを利用できるようにすることです。これは今までにない試みですが、様々なメリットが想定されます。複数の研究者のデータを総合してひとつの言語地図を作成することで新しい知見を得られるかもしれないこと、また、言語地図と調査データをあわせて公開することでお互いに成果を検証できるようになることなど、さまざまな可能性を持ちます。
 もうひとつは、使いやすい標準的な言語地図作成プログラムを作成することです。現在の段階でも、各地の方言学者や方言に興味を持つ方たちによってコンピュータ上に言語地図が作製され続けていると思われますが、いまだデファクトスタンダードとなる地図作製ソフトウェアは存在しません。このような状況はデータの再利用の観点から今後の方言研究のために役に立つとは考えにくく、早い段階で標準となることを見据えたソフトウェアが提供されるべきです。


 この二つのねらいを実現するために、デスクトップで動くアプリケーションではなく、Webアプリケーションとして作成します。
 いろいろな領域でグローバル化が進行している昨今、ローカリティを確保するために方言はもっと注目されるべき存在だと考えます。そのためにも研究者の集めた方言データを一般公開する意義は大きいのではないかと考えます。




8.採択理由


 新しい研究分野やバイオのようにお金が動く研究分野ではあたりまえに使われているコンピュータやネットワーク. しかし,伝統的な研究分野ではなかなか浸透しないし,その利便性もほとんど理解されない. 

 方言研究を根本から変えてしまうかもしれないシステム. また,市井の方言研究者にとっても,1次データに触れられるチャンスであり,裾野を広げるのにも役立つ.

 




9.開発目標

言語学の方言地理学の分野ではいっぱんにITの導入が遅れており、研究者は研究のツールについて苦労をする状況が続いている。

方言地理学では言葉の地方ごとの異なりを「言語地図」というかたちで表示するが、言語地図を作成する簡単なツールはあまりない。

また、言語地図をPC上で作成するためにWeb上で作成するソフトは提供されてこなかったし、言語地図を簡単に公開、共有する仕組みも提供されてこなかった。

そこで、Web上で言語地図作製の作業を行えるだけではなく、その成果をWeb上で発表できるサイトを作成することにした。

Webに乗せることで言語学をもっぱらにする研究者に使用してもらうだけでなく、方言に興味を持つ一般の方の参加も目的とする。これは、方言研究については専門家と一般の興味との乖離が激しいと考えられるからで、それを埋める役割を担うサイトにしていきたい。

 




10.進捗概要

1.1. サーバ環境

ハードウェア:さくらの専用サーバ Athlon4800 メモリ1GB HDD 160GB
FreeBSD5.4
の上にjailで構築された仮想OS環境。

1.2. プログラム

1.2.1.Webサーバ

lighttpd + ruby_fcgi

1.2.2.プログラム言語

プログラム言語:Ruby
Web
フレームワーク:Ruby on rails 1.1

1.2.3.データベースソフトウェア

mysql 4

1.2.4.地図・地形データ

GooleMap API2.0 を利用して取得

 




11.成果

1.3.
設計

1.3.1. テーブル設計

リレーション


 

1.3.2. クラス設計

<言語地図関連のクラス>

Questionクラス:質問項目を表すオブジェクト
 質問名、質問内容を保持する

Informantクラス:発話者情報を表すオブジェクト
 発話者名、発話者情報、地点名、地点の住所、調査情報を保持する

Answerクラス:回答情報を保持する
 QuestionInformantに結びついた回答(語形)情報を保持する

Atlasクラス:派生地図を表すオブジェクト
 派生地図名を保持する

Markクラス:派生地図の記号を表すオブジェクト
 マークの形、色、凡例、マッチパターンを保持する

<言語地図関連クラスの隠蔽>

この5つのクラスを抽象化して、ユーザには「言語地図」(Question + Answer)、「地点」(Informant)、「派生地図」(Atlas + Mark)の組み合わせとして見せるようにする。

「言語地図」とは、語形をそのまま表示する地図のことを示す。方言地理学では資料地図と呼ばれるものに当たる。「派生地図」とは、「言語地図」をもとに研究者の観点を加えて加工した地図のことを示す。方言地理学では解釈地図と呼ばれるものに相当する。

 

<ユーザ関連クラス>

Userクラス:登録ユーザを表すクラス
 名前、ログイン名、ハッシュパスワードなどを保持する
Group
クラス:グループを表すクラス
 グループ名、アクセスレベルなどを保持する

 


1.3.3. アクセス制限の設計

言語地図の共有・公開を実現するために、言語地図と派生地図、地点、回答についてアクセス制限ルールを以下のように設定する。すべてのオブジェクトについて、名前・データの変更などの編集機能は作成者にのみ認められる。

言語地図のアクセス制限ルール
 公開レベル:公開しない → 作成者以外は閲覧できない
       グループに公開 → 言語地図の属すユーザのみ閲覧できる
       全体に公開 → だれでも閲覧できる(未登録ユーザ含む)
 追加レベル:追加できない → 自分以外はデータを追加できない
       グループのみ追加可能 → 言語地図の属すユーザのみ追加できる
       誰でも追加できる → 登録ユーザなら誰でも追加できる

派生地図のアクセス制限ルール
 公開レベル:公開しない → 作成者以外は閲覧できない
       グループに公開 → 言語地図の属すユーザのみ閲覧できる
       全体に公開 → だれでも閲覧できる(未登録ユーザ含む)

地点のアクセス制限ルール
作成者(所有者)以外は閲覧・データ追加できない

 

回答のアクセス制限ルール
公開レベル:帰属する地図の公開レベルと同じ

 


1.4. 実装画面

1.4.1. トップページ

トップページでは、公開されている言語地図とグループの一覧が表示される。

右上のメニューからログインして自分独自の画面(マイページ)に移動することができる。

 


1.4.2. ログイン画面

すでに登録しているユーザはログインしてサイトの全機能を使えるようになる。

ログインパスワードを忘れた場合は、メールアドレスを入力することでパスワードの再設定が可能になる。

 

1.4.3. 新規ユーザ登録

メールアドレスなどを登録して専用アカウントを作成できる。

 


1.4.4. マイページ

マイページでは、自分の所有する全オブジェクトの情報を見ることができる。

タブインターフェースにより、言語地図・地点・グループ・メッセージの画面切り替えを行う。タブの内容は非アクティブなものであっても表示されていないだけなので、切り替え時の動作はタブ切り替えのたびに内容をサーバから読み込む通常のWebアプリケーションに比べて軽快になっている。

 


1.4.5. 言語地図の作成

マイページから言語地図を作成できる。

諸種情報の他、所属するグループ、公開レベル、データの追加レベルを設定できる。

作成後は言語地図画面の「編集」タブからこれらを変更可能。

 


1.4.6. 言語地図表示

言語地図表示画面では、回答がマークとして地図上に表示される。

GoogleMapを利用しているので地図の移動、拡大縮小が可能。また、背景地図の透明度を変更してマークを見やすくすることができる。

 


1.4.7. 言語地図への回答追加

自分が追加権限を持っている場合は、言語地図にデータを追加することができる。

自分の所有する地点は緑色で表示される。

緑色の地点をクリックするとその場で回答を入力できる。音声ファイルも登録可能。

 

1.4.8. 派生地図の作成

公開されている言語地図のデータを使い、それについて独自の見地からまとめた派生地図を作ることができる。

公開レベルの設定が可能。

作成後は派生地図画面の「編集」タブからこれらを変更可能。

 


1.4.9. 派生地図の凡例編集

派生地図では、それぞれの語形をどの凡例に分類するか指定できる。

「マーク」は形と色の組み合わせを自由に選ぶことができる。

「パターン」にはふつうの文字列、あるいは正規表現をカンマで並べて複数記述でき、簡単に語形を分類することができる。

どの凡例にも当てはまらない語形は、”No match”と表示される。これは「パターン」を修正するたびにリアルタイムでアップデートされる。

 


1.4.10. 派生地図の表示

派生地図では、もとになる言語地図よりも少ない数の凡例が表示される。

派生地図の作成者は、地図表示の際のデフォルトの中心位置、ズームレベル、背景地図の透明度を決めておくことができる。これは言語地図でも同様。

 


1.4.11. 地点の新規登録

マイページから地点を作成することができる。

地点の場所は右の地図でクリックしたところになる。

HOUGEN.jpでは地点とインフォーマントが同一オブジェクトなので、地点の編集時にインフォーマント情報も記述する。

作成後は地点画面の「編集」タブからこれらを変更可能。

 


1.4.12. 地点の回答一覧

その地点で登録された回答の一覧。

現在、ここでは閲覧しかできないが、同画面で回答データを一括して修正できるようにする予定。

 


1.4.13. グループの新規作成

マイページからグループの新規作成を行うことができる。

グループは、共同で言語地図や派生地図を作りたい場合、また、自分の作成した地図を特定のユーザのみに見せたいときなどに用いる。

参加資格として「誰でも参加できる」か「作成者の許可が必要」かを選択できる。「作成者の許可が必要」なグループに入りたい場合は、作成者にメッセージを送る。

作成後はグループ画面の「編集」タブからこれらを変更可能。

 

1.4.14. グループのメンバー一覧

「メンバー一覧」タグでグループに所属するメンバーの一覧が見られる。

 

1.4.15. グループのメンバー編集

グループの作成者はメンバーの追加・削除を行うことができる。

 

 

1.4.16. グループへの参加

誰でも参加できる設定になっているグループの場合は、ユーザが[参加する]をクリックすることで自分から参加できる。

 


1.4.17. グループの掲示板

グループはそれぞれ専用の掲示板をもっており、メンバーは自由に書き込むことができる。

 

1.4.18. グループ掲示板への書き込み

[コメントする]をクリックすると既存の記事にコメントできる。

ここでも画面遷移は起こらず軽快に使用できる。

 

1.4.19. 他ユーザへのメッセージ送信

他ユーザのトップページから、[メッセージを送信]をクリックすることでそのユーザにメッセージを送ることができる。

メッセージの作成

 


1.4.20. メッセージの受信

自分にメッセージが送信されている場合は、ログイン時に件数が表示される。

新着メッセージのタイトルは赤字で表示される。

 


1.4.21. メッセージへの返信

メッセージのタイトルをクリックすると内容が表示される。

[返信する]をクリックすると返信フォームが現れる。

どの操作も画面遷移しないので軽快に使用できる。

 

 




12.プロジェクト評価


今までの言語地図作製アプリケーションと比較した場合、以下のような特徴を持つ。
(1)
共同作業が可能なこと
 →より大規模・詳細な地図が作成できる
(2)
言語地図と派生地図の区別を持つこと
 →ひとつの言語地図データについてさまざまな解釈を示すことができる
 →最初は生に近い詳細なデータを入力しておき、あとで集約できる
(3)GoogleMap
を利用していること
 →拡大縮小が簡単に行える
 →地点の選択をGUIで行える
(4)
ユーザのレベルによってさまざまな関わり方が可能なこと
 →研究者は派生地図によって方言地理学の基礎データを作成できる
 →一般ユーザは全国のユーザの協力によって自分だけでは作れない大規模な
  地図を作ることができる

 




13.今後の課題

主な対象とするユーザによって今後の展開に違いが生じうるので、HOUGEN.jpの使われ方を見ながら今後の方向性を決めていくが、すでに必要性が感じられるもとしては、

研究者ユーザには、
・専門的なデータ解析の機能
・まとめてデータを入出力できる機能

一般ユーザには、
・簡単な回答の作成
・公開地図のわかりやすい分類

が今後の開発課題としてあげられる。

 



  ページトップへ   

 

 




  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004