IPA


IPAトップ





平成15年度未踏ソフトウェア創造事業  採択案件評価書


 



1.担当PM


 石田 亨   (京都大学大学院 情報学研究科 教授)



2.採択者氏名


 代表者

大向 一輝(国立情報学研究所)

共同開発者

濱崎 雅弘(総合研究大学院大学数物科学研究科情報学専攻/国立情報学研究所)
安達 真(早稲田大学理工学部情報学科)



3.プロジェクト管理組織


 株式会社ジェイテックプレーヤーズ



4.委託金支払額


 9,974,988円



5.テーマ名


 Semblog: セマンティックウェブ技術を用いたスモールコンテンツの再編集・共有プラットフォーム



6.関連Webサイト


 http://www.semblog.org/



7.プロジェクト概要


本プロジェクトはWeblogとセマンティックウェブ技術を組み合わせて情報の共有・再利用・再編集を可能にするプラットフォーム「Semblog」を提案している. 基本的な戦略は, Weblogの持つコンテンツマネジメントシステムによってセマンティックタグを自動的に付加する機能を提供し, 引用と再編集の概念を用いて既存のコンテンツにもセマンティックタグを付加できるようにすることである. また, 生成されたセマンティックコンテンツはHTMLに変換しないままでもアクセスできるようにし, 閲覧者がそれらのコンテンツを自由に再編集することを可能とする.

本プロジェクトではこれらのセマンティックコンテンツを生成・編集・管理するために各ユーザが持つSemblogサイトと, セマンティックコンテンツを有効活用するためのセマンティックサービスを開発する. このシステムによって, 個々のコンテンツを様々な切り口から利用できるようになる.




8.採択理由


本申請ではblogとセマンティックウェブ技術を組み合わせて情報の共有・再利用・再編集を可能にするプラットフォーム「Semblog」を提案しています。 新しい形の情報共有を目指す試みで、様々なアイデアが生まれる可能性が大きいと思い採択しました。 ホットで魅力的なテーマへの挑戦ですから、スピードと有用性が勝負となると思います。 申請者のチームは未踏2年目でということなので、技術力とスピードを併せ持った展開を期待したいと思います。




9.開発目標


本プロジェクトではセマンティックウェブ技術とWeblogツールを用いてユーザの情報収集から生産,公開までを統合的に支援するためのシステム開発を目標としている.現在のセマンティックウェブ研究ではオントロジを中心とした"Heavy Weight"なメタデータによる情報処理が盛んであるが,実世界に適用した場合にオーサリング等の困難さから一般的に普及するとは考えにくい.このプロジェクトはRSS等の"Light Weight"なメタデータにより情報流通を活性化することを目指している.情報収集および情報発信に際しては,"Check","Clip",および"Post"という3レベルを定義し,興味の強さに応じて情報の配信プロセスを変える.このシステムを利用することで,ユーザは各人の視点に基づく情報収集および情報発信を容易に行うことが可能になる.

最も弱い"Check"レベルとは,ユーザが特定のWebサイトや情報ソースに日常的にアクセスすることを意味する.ユーザはそのWebサイトのコンテンツ内容をあらかじめ知っているわけではないが,過去の更新履歴からどのような情報が掲載されうるかを知っている.本プロジェクトでは,このような知識が情報流通において重要な働きを持つと考え,ユーザが日常的に巡回するWebサイトのリストを公開することで,そのユーザがどの分野に興味を持っているかを表明するための支援を行う.

次の"Clip"レベルとは,ユーザが閲覧したコンテンツの中でとくに興味があるものを指定し,保存することで,後日同じコンテンツに再びアクセスしやすいようにすることを意味する.開発するシステムでは,"Check"レベルで登録されたWebサイトに含まれるコンテンツの中でユーザがとくに興味があるものを指定することで,指定されたコンテンツのリストを作成,公開の支援を行う.




10.進捗概要


これまでに,サービス型RSSアグリゲータであるRNAおよびWindows用スタンドアロン型アグリゲータであるglucoseの開発を終え, 配布を始めている.

RNAはPerlで記述されたCGIプログラムである.ユーザは自身が持つWebサーバにこれを設置して運用することができる.ユーザが他サイトのRSSを登録すると,RNAはファイルの取得,パース,RDFツリーの組み替え,テンプレート適用処理を行い,複数のサイトからの最新のコンテンツを一覧表示する.またTrackBackリンクの抽出による,サイトをまたがった議論の一覧表示や,ユーザの興味のあるコンテンツを保存・再公開するクリッピング機能を持つ.さらには複数のRNAを連携するためのインフラストラクチャーを実装している.さらに, FOAFメタデータの生成機能および,FOAFによる複数のRNA間の連携機能(FOAF TrackBack)を実装している.最新バージョンでは外部サービスとの連携機能として,RSS全文検索エンジンの検索結果を取り込めるようにしている.

glucoseはWindows PC上で動作するクライアント型RSSアグリゲータである.既存のクライアント型アグリゲータと異なり,glucoseではRNAとの連携によって情報の流通プロセスを支援することを目指している.ユーザが登録したRSSおよび外部のRSS全文検索エンジンからのキーワード検索機能が実装されている.また,FOAF登録機能を備え,FOAFファイルの閲覧や,ファイルに記述されたサイトの登録が可能となっている.




11.成果


RNAおよびglucoseによってRSSの流通が容易になっている.これまでWebにおいてはコンテンツの作成者と閲覧者の役割が分離されていたが,本プロジェクトのツールを用いることにより情報収集から情報公開までのサイクルが短縮化,容易化され,ユーザの意思表明が即座に新しいコンテンツとなって公開される.

また,セマンティックウェブの分野への貢献としては,ソフトウェアの開発と並行してRSSフォーマットの拡張案を提案し,活発な議論を行っている.この結果はすでに, 本プロジェクトで開発中のソフトウェアにも取り入れられており,今後メタデータを利用したい開発者にとって役立つと思われる.

SemblogシステムではRSSやFOAF等のLight Weightなメタデータにより情報流通を活性化することを目指し,ユーザは各人の視点に基づく情報収集および情報発信を容易に行うことが可能になる.アプリケーションはFOAFメタデータにいち早く対応しており,今後普及が予想されるソーシャルネットワーキング技術のクライアントとしても利用可能である.サービスアプリケーションとしては,複数のRNAをFOAFリンクで接続し,類似度計算に基づくコンテンツ推薦を行う「RNA Alliance」や,ユーザ自身のサイトを中心とした小規模なコンテンツネットワークを構築し,その中からコンテンツを推薦する「Egocentric Search」のプロトタイプを実装している.また,Weblog用メタデータ体系の提案と運用方針を統一するための議論の場として「Rough Semantics」という活動を開始している.

Webサイトは, http://www.semblog.org/で公開されている. 記事としては, Software Design 2003年8月号, ネットランナー 2003年10月号, 日経パソコン 2003年12月号, iNTERNET magazine 2003年12月号, ネットランナー 2004年1月号, UNIX USER 2004年3月号, ZDNet Japan News(現ITmedia)他がある.

論文は以下の3件が発表されている.
Ohmukai, K.Numa and H.Takeda. Egocentric Search Method for Authoring Support in Semantic Weblog. Workshop on Knowledge Markup and Semantic Annotation (Semannot2003), Held in conjunction with the Second International Conference on Knowledge Capture (K-CAP2003), 2003
Ohmukai and H.Takeda. Semblog: Personal Knowledge Publishing Suite. Semantic Web Challenge in the 2nd International Semantic Web Conference (ISWC2003), 2003
Ohmukai et al. Semblog: Personal Knowledge Publishing Suite. The 13th International World Wide Web Conference (WWW2004), 2004




12.プロジェクト評価


SemlogプロジェクトはWeblogとメタデータを利用した情報流通環境の構築を目指している. 具体的にはRSS Aggregatorの高度化を目的にCheck, Clip, Post (収集、編集、公開)プロセスを一貫して支援し、かつプロセスそのものを公開する. そして, RSS AggregatorとしてglucoseとRNAを開発している.

RNAはRSSのコンテンツの収集を行うサーバ用ソフトである. たとえば、URIを数十個登録すると, スクリプトがページを収集しサマリーを表示する.TrackBackを抽出し表示する機能も備え再配信している. これによってWeblogサイトを持っている人たちであれば, コミュニティサイトをすぐ作ることができる. Pure Perlでの実装, 徹底したカスタマイズ性を備えたことによって, 既に1200件のダウンロード実績がある.

glucoseはクライアント側のソフトである. 単なるリーダーではなく, レポジトリとして機能する. FOAFに対応しsocial networking用のツールとして発展させようとしている. ダウンロード数は10000以上の実績がある。

Semblogプロジェクトの活動は各種メディアでも取り上げられている. Software Design誌,日経コンピュータ誌,iNTERNET Magazine誌,ネットランナー誌およびZDNet Japanサイトにおいても掲載されたことは評価できる.

最終報告会では, 高い評価を受ける一方で, RSSの次の段階の提案としては設計コンセプトが弱いという指摘もあった. セマンティックWebの流れの中で, 時機を捉えた発展に期待したい.




13.今後の課題


これまでは, メタデータの流通インフラの構築が中心であった.今後は, RNAおよびglucoseの応用を考えていく必要がある. RNAについては, ホスティングサービスとしての提供が課題である. DBMSを用意し検索性を高める, アクセス解析を導入しコンテンツの推薦機能等に結びつける, などの展開がある.複数のユーザ間でのコンテンツ推薦アルゴリズムのモデル化および実装も期待したい.

glucoseについてはP2P配信の性能向上が重要な課題となる.glucose内蔵のHTTPサーバ,P2P機能を利用し,組織内の分散型情報共有システムに発展することを期待する.また,ソーシャルネットワーキングサービスのクライアントとしての利用,用途に応じたコンテンツ入力インタフェース,情報の検索性を高める新しいGUIの開発が必要である.

システム開発が進む一方で, 個々人の社会ネットワークを用いた検索という当初の目標は曖昧になりつつあるように感じる. ユーザの視点にたってメタタグの活用を考えてみることも必要だろう.


  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004