IPA


開発成果一覧へ





2004年度第2回未踏ソフトウェア創造事業  採択案件評価書


 



1.担当PM

 

 原田 康徳  (NTT コミュニケーション科学基礎研究所 主任研究員)



2.採択者氏名


 代表者

 宮脇 文経 (株式会社エス・クルー)

共同開発者

 宮脇 清美 (株式会社みずほ銀行)



3.プロジェクト管理組織


 エヌ・ティ・ティ出版株式会社



4.委託金支払額

 

 1,297,207円



5.テーマ名

 

 源氏物語の鑑賞支援ツールの開発・整備



6.関連Webサイト


 源氏物語の世界:http://www.sainet.or.jp/~eshibuya/index.html
 源氏物語の世界 再編集版:http://www.h2.dion.ne.jp/~miyawaki/Genji/



7.テーマ概要


 源氏物語の鑑賞に役立つ各種の情報を,IT技術を駆使して使いやすい形に整理し,さらに源氏物語に興味を持つ人たちの新たなコミュケーションツールにもなりうるソフトウェアを開発する.




8.採択理由

 

 申請書のうち,「複数のファイルの行単位の対応関係を表現し,それを見やすく表示するプログラムとデータ構造」の部分を対象として採択することにした.
 これまでの申請者の活動を生かしながら,独りよがりにならないように,ユーザが求めているシステムはどのようなモノかをよく調べて,進めていただきたい.



9.開発目標


 現在,源氏物語の本文,注釈,現代語訳などを使いやすい形に整理して公開するWebサイトとして,「源氏物語の世界 再編集版」がある.そのサイトでは,高千穂大学の渋谷教授がWebサイト「源氏物語の世界」で公開している源氏物語の本文,注釈,現代語訳などを読みやすい形式に再編集して公開している.
  この再編集は,専用の再編集プログラムを作って行っているが,現状では,渋谷教授の本文,注釈,現代語訳に特化しているため,柔軟性に欠けている.そこで,今回は,この再編集プログラムのデータ構造に着目し,それを整理・改善して,新たなコミュケーションツールに必要な柔軟性を獲得することを主目的とした開発を行う.
  また,このプロジェクトの賛同者を募り,複数の人間が参画して源氏物語の鑑賞に役立つ情報の整備を進めていくための環境も整備する.




10.進捗概要


 プロジェクトの目標は,ボランティアなどの第三者が,コンテンツを容易に拡張できること,しかも,複数の第三者が独立に拡張作業を行っても,混乱なく,容易にコンテンツが拡張できることである.

  次の図は,この目標のイメージを説明したものである.白い部分は,現在の「源氏物語の世界 再編集版」にすでにある部分,水色の部分が,今回の目標とする部分である.

 

 





11.成果

 

1 XML/XSLTとPHPによる実現法

  

 複数の第三者が関与して混乱なく更新できるようにするには,今の「源氏物語の世界 再編集版」のような,バッチの再編集プログラムを実行してすべてを一括生成するような方法ではなく,できるだけ小さなファイルに小分けして,独立した形で更新できるようにする必要がある.
 

 いまでも,再編集版は段ごとにファイルが分かれているので,小分けできているように思えるが,段ごとは少々細かすぎます.帖ごとか,若菜のような大きな帖でも章ごと程度が便利である.
 

 また,複数の人が関与するといっても,人によってテーマは違っていることが多いので,テーマごとにファイルは分かれていたほうがよい.たとえば,輪読会などの進度にあわせて,複数人で手分けしてデータを整備する場合,皆,同じ帖や章を対象にするが,人によって,注釈を整備する人,現代語訳を整備する人,挿絵などのオブジェクトを整備する人などに分かれることになるだろう.そこで,ファイルもこのような分類ごとに分かれている方が望ましい.
 

 もともと,渋谷教授のサイトでは,本文,注釈,現代語訳,ローマ字版の4つに分かれていたが,さらに以下のような条件を考慮する必要がある.

 1. 複数人が関与するので,ファイルは帖/章ごと,かつ,テーマごとに分かれている.
 2. ブラウザで表示するときは,統合して表示する.
 3. 更新された内容は,自動的に,すみやかに更新される.
 4. クライアントはインストールレスで簡単に使える.
 5. サーバの負荷が重くならないこと.
 

 これらを同時に満足する実現方法は,いくつか考えることができるが,これを,XML/XSLTとPHPを使って実現することにした.その概略イメージを,次ページの図に示す.


 

 この例は,以下のようである.

 
 1. ファイルは本文,現代語訳,与謝野晶子訳,注釈の4種類に分け,それぞれをXML形式で記述する.
 2. ブラウザで表示するときは,HTMLページからリンクされたXML/XSLTと変換スクリプトを実行することによって, 今の再編集版と同様な見やすく統合されたHTMLに変換して表示する. すなわち,毎回,最新版のXMLファイルをダウンロードするので,更新された内容は,ただちに表示に反映される.
 3. XML/XSLTはブラウザの標準機能なので,クライアントはインストールレスで簡単に使える.ただし,開発の都合から,当面は,Internet Explorer 6.0のXML/XSLT仕様に限定して対応する.
 4. サーバでは,PHPによって使用するXMLページへの参照を生成するだけなので,負荷はほとんどかからない.

2 マルチメディアデータの扱い

 次に,挿絵,動画,音声などのマルチメディアオブジェクトの挿入の仕掛けについて説明する.
テキストの場合は,本文と現代語訳などの複数のテキストを如何にして行単位に対応付けるかが課題であったが,マルチメディアオブジェクトの場合は,どこに何を如何にして挿入するかが課題になる.
 HTML形式の再編集版では,このようなオブジェクトとしては,絵入源氏物語の挿絵があるだけであった.その挿絵は,行と行の間に<IMG src=”xxxx.gif”>タグで挿入される形になっており,その挿入位置は,渋谷教授のオリジナルサイトのローマ字版で挿絵が挿入されている位置にあわせてあった.

 今回のXML形式の再編集版では,挿絵だけでなく,動画や音声などのHTMLオブジェクトも扱えるようにすることを考えているが,これは,挿入するタグを<IMG>タグに固定せず,任意のHTMLタグを挿入できるようにすることで実現する.したがって,XMLでは,挿入位置と挿入するHTMLテキストを組にして定義することになる.

 今回は,このようなオブジェクトとして,「絵入源氏物語の挿絵」の他に,「ユネスコによる絵入源氏物語の挿絵と解説」の2種類を実現した.このうち,前者はHTML版同様に<IMG>タグを使うが,後者は<IFRAME>タグを使ってユネスコのサイトの該当ページに直接リンクすることで実現する.そして,そのすぐ下にユネスコのサイトへのリンクを付けて出典を明記し,その位置合わせのために<TABLE>タグを併用する.

 参考のため,この2種類のオブジェクトのXMLデータの例を以下に示す.網掛けの部分が挿入位置の定義と,挿入するHTMLテキストである.
 

 (1)「絵入源氏物語の挿絵」のXMLデータの例 

<?xml version="1.0" encoding="Shift_JIS"?>
<オブジェクト name="絵入源氏物語の挿絵">
<帖 no="01" name="桐壺">
<章 no="1" name="第一章 光る源氏前史の物語">
<段 no="2" name="第二段 御子誕生(一歳)">
<挿絵 no="1">
<![CDATA[<IMG src="../eshibuya/eiri/eiri001.gif"/>
]]><挿入 行="2"/></挿絵></段></章></帖></オブジェクト>

 

 (2)「ユネスコによる絵入源氏物語の挿絵と解説」のXMLデータの例

<?xml version="1.0" encoding="Shift_JIS"?>
<オブジェクト name="ユネスコによる絵入源氏物語の挿絵と解説">
<帖 no="01" name="桐壺">
<章 no="1" name="第一章 光る源氏前史の物語">
<段 no="2" name="第二段 御子誕生(一歳)">
<挿絵 no="1">
<![CDATA[<table><tr><td align="right">
<iframe src="http://webworld.unesco.org/genji/jp/part_1/1-1.shtml" width=750 height=424 scrolling=no> </iframe>
<br><small><a href="http://webworld.unesco.org/genji/index.shtml" target="unesco">ユネスコの源氏物語のサイト</a>より</small>
</td></tr></table>
]]><挿入 行="2"/></挿絵></段></章></帖></オブジェクト>


 

3 再編集仕様の設定

 HTMLページでは,XSLTでの再編集処理を制御する以下のようなオプションを指定できるようにした.

 

 

 このフォームは,デフォルト状態であるが,対照表示するテキストのプルダウンメニュー項目と,リンクするコメント名の一覧,挿入するオブジェクト名の一覧は,新たなテキストやコメント,オブジェクトがアップされたときには自動的に追加される.
 

 また,以前のバージョンでは表示の修飾がデータごとに固定されていたのであるが,今回は選択項目を増やして,個別に指定できるようにした.
 

4 ボランタリ作業者による与謝野晶子訳の整備

 与謝野晶子訳の整備は,ボランタリ作業者を募って,本年3月中頃から8月中頃に行った.
 この結果,全54帖のすべてで突合せ作業は終了し,現在,以下のような状況となった.
 

プロジェクト開始時の状況

ボランティアによる突合せ

開発者による最終確認

インターネット公開

第1帖 桐壺 〜

第5帖 若紫

開発者が突合せしたものを公開済み

-

-

第6帖 末摘花 〜

第33帖 藤裏葉

未着手

未着手

第34帖 若菜上 〜

第41帖 幻

未着手

第42帖 匂兵部卿 〜

第46帖 椎本

未着手

未着手

第47帖 総角

開発者が突合せしたものを公開済み

-

-

第48帖 早蕨

未着手

-

(突合せも開発者が実施)

第49帖宿木 〜

第54帖 浮舟

未着手

未着手

 




12.プロジェクト評価


 今後に発展する非常によい土台ができた.申請書の内容とは大幅に異なる,ほとんど0からの開発であったが,驚くべき成果を上げた.爆発的なヒットを狙うというよりは,日本の文化と最先端技術とが融合した息の長い活動の基礎となるものが出来たと考える.開発者はほとんど休日のプログラミングのみでこのようなシステムを開発し,その能力の高さも実証した.

 



13.今後の課題


 対象が源氏物語であるから,ボランティアとしてデータを入力する人たちは,ITにあまり詳しくない可能性が高い.そこで,簡単にデータをアップロードする仕掛け(ユーザ登録,認証,管理,アップロード)の整備を急ぐ必要がある.
 座標,桁属性などは,簡単なGUIツールがあると,その入力が簡単になるであろう.


  ページトップへ   





  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004