IPA


IPAトップ





2005年度未踏ソフトウェア創造事業(未踏ユース)  採択案件評価書


 



1.担当PM


 竹内 郁雄   (東京大学大学院教授)



2.採択者氏名


 代表者

大澤 亮(慶應義塾大学 大学院 政策・メディア研究科 修士課程)

共同開発者

なし



3.プロジェクト管理組織


 リトルスタジオインク株式会社


  4.委託支払金額


 3,000,000円



5.テーマ名


 ユーザ動作を基にしたデータ間関連度 とデータ着目度算出機構



6.関連Webサイト


 http://oredesk.net/



7.プロジェクト概要

 ユーザは文書や画 像,映像,音楽のデータなどのデータを日々PC上で閲覧する.その過程において,ユーザが明示的な保存 (ブラウザのブックマークなど) をしなかったデータを再度閲覧したいと思う状況がしばしば起こる.しかし,そのような状況でユーザが目的のデータを閲覧履歴から探すのは容易ではない.閲 覧履歴を時系列順に一覧表示したとしてもデータ数が膨大な場合,見つけるのは困難である.
 そこでユーザがデータを閲覧した際の動作に基づいてデータ間関連度とユーザのデータ着目度を算出し,関連度を用いた関連検索機能とデータ着目度による ソート機能を履歴検索に付加し,ユーザの履歴検索を支援するソフトウェアを提案する.
 関連検索とは,Googleの関連ページ機能のように,あるデータに関連したデータを提供する手法である.人間の記憶は連想からなるので,状況次第では ユーザの履歴検索を有効に支援できる.データ着目度とは,GoogleにおけるPage Rankのような,データの相対的な着目指標である.データ着目度を用いることでユーザが過去に着目したデータを検索結果の上位に表示できる.また,ユー ザ動作とデータ着目度の関係はユーザのフィードバックを参考にシステムが自動調整を行なう.
 本提案ソフトウェアの目的は,ユーザに普段の手動操作を要求しない手法で,履歴データ検索を効率化することである.また,データ中の文章とのキーワード マッチングを高速化するため,一部Google Desktop SDKを利用する.




8.採択理由


 ユーザの行動履歴を使 い,ユーザの情報検索と再参照を補助できるようにするツールの提案である.いくつかあった類似の提案の中では,ユーザ動作のセンシングに関するアイデアが 最もしっかりしていた.といっても,これはもっと深く堀り下げて追求する価値のある課題である.ユーザ動作のセンシングがしっかりしていないと,そのあと どんなに高度な計算をしようとしても,結局砂上の楼閣だからである.予備的な実装も進んでいるので実現可能性も高い.



9.成果概要


 本プロジェクトでは, ユーザがWindows上で行なった操作履歴を保持し,それらの履歴から,ローカルディスクに保存された文書,画像,映像,音楽などのデータや,Web上 にあるデータを想起可能にするソフトウェア「俺デスク」を実装した.俺デスクは関連検索ツールとタイムラインビューアをユーザに提供する.

 関連検索ツールとは,あるデータに関連するデータを検索できるツールである.俺デスクはユーザ操作の履歴情報に基づいてデータ間関連度を算出する.具体 的には参照時刻,テキスト内検索,クリップボードの利用履歴などが関連しあっているデータ同士ほど関連度が高くなる.ユーザ操作に基づいた関連度を用いる ことで,検索システムはユーザに対して参照記憶に基づいた検索を提供できる.たとえば,ユーザは検索システムに対して「Wordを使って企画書を作成して いたときに参照していたWebページを検索せよ」といった要求ができる.人間の記憶は連想からなるため,ユーザのデータ参照履歴の検索を効果的に支援でき る.
 関連検索ツールの画面を図2.5.1 関連検索ツール に示す.ユーザはファイル名や文中のキーワードなどから目的のデータを検索できる.図の画面上では,検索結果が検索対象データと関連の強い順に表示され る.キーワードとしてアクセス日時,ユーザの特定操作を入力できる.
  

  

  

   図2.5.1

    2.5.1 関連検索ツール

  

  また,Google Desktop SDKを利用し,ファイル内に含まれている文字列も並列して,検索にかけることができる.具体的には「ファイルAに関連があって,地図という語句が含まれ ているファイルを検索」といった要求が可能になる.
 ユーザに対して関連するデータを探しやすくするために各種アプリケーション用にプラグインを作成した.たとえばInternet Explorerにはツールバーを用意し,そこから現在見ているページに関連のあるデータを検索できる (図2.5.2 関連検索を行なうツールバー).
 関連検索ツール内の属性アイコンとは,それぞれのデータにおいて過去のユーザ操作がどのような特徴をもっているかを示すアイコンである.俺デスクは過去 のユーザ操作からデータに図2.5.3 属性アイコンの属性アイコンを自動付与する.これは今後もっと増やし,機能も充実させる予定である.

   図2.5.2

     2.5.2 関連検索を行なうツールバー


  また,動的属性付与のアルゴリズムを応用し,ユーザコンテキストに応じてシステムが動的に各種の処理を行なうシステムを実装する予定である.たとえ ば,ユーザが頻繁に閲覧し,一閲覧あたりの閲覧時間が短いWebページを「確認用ページ」と定義し,「確認用ページ」に分類されたページを常に監視し,変 更があったらユーザに知らせるといったことを想定している.

 タイムラインビューアを図2.5.4時間帯を指定して必要な参照履歴情報を見つけるに示す.タイムラインビューアはユーザのデータ参照状況を視覚化した ものである.タイムラインビューアは,横軸に時間をとり,データ参照時間をラインで表示し,その中央にユーザが実際に参照したWebページやドキュメント のサムネイルを表示する.タイムラインビューアを使うことで「一昨日の夜中に参照していたレストランガイドをもう1回見たい」という要求が可能になる.縦 軸はデータ着目度を表しており,データ着目度が高いデータほど上に表示される.データ着目度とはユーザのデータに対する注目の度合いを示した指標である. データ着目度は,データの参照時間や参照回数,選択文字列の反転回数などの計測結果から算出され,これらが大きいほど着目度は高くなる.これを利用して, ユーザが過去に深く参照していたと思ったデータを探す場合は上側を探し,一瞬だけ参照したデータを探す場合は下側を探しに行くといった使い方ができる.

    図2.5.3

      2.5.3 属性アイコン

   

    図2.5.4

     2.5.4 時間帯を指定して必要な参照履歴情報を見つける

  

 

 

  俺デスクのシステム構成を図2.5.5 俺デスクの全体構造に示す.俺デスクはOSとアプリケーションのイベントを取得し,それらをデータをメタ情報として保存する.そして,アプリケーションか らの要求に応じて,メタ情報データベースからデータ間関連度とデータ着目度を算出する.そしてそれらの値を応用した関連検索ツールとタイムラインビューア をユーザに提供する.

    

     図2.5.5

     2.5.5 俺デスクの全体構造

  

  俺デスクは基本的にOSのイベントをフックするが,それに加えてアプリ ケーションのイベントもフックする.アプリケーションのイベントを監視するためには,アプリケーションごとにプラグインを作成しなければならない.これま でMicrosoft Office,Internet Explorer,Mozilla Firefox,OpenOffice.org,Skype用のプラグインを作成した.OSはWindows 2000/XPに対応し,開発言語はC++を用いた.データベースエンジンは提供ソフトウェアに組み込み可能なSQLiteを利用した.また,語彙のパ ターンマッチングにはGoogle Desktop SDKを用い,関連検索ツールのGUIはMFC,タイムラインビューアのGUIはDirectXで実装した.DirectXを利用する際,低速のマシンで も動作するようにフレームレートを落とした.また,イベント監視対象となっていないアプリケーションも細かい指定はできないが検索対象にはできる.
 俺デスクは付加的機能として,ユーザのフィードバックに基づいて要素と着目度の相関係数を求め,動的に重みを調整するフィルタ機構を持つ.データ着目度 の計算が常にユーザにとっての着目度と相関が高いとは限らないからである.たとえば,あるユーザが着目する資料に対して選択文字列反転をする癖があったと しても,別のユーザにその癖があるとは限らない.そこで,ユーザが現在見ているデータに対して着目度を陽に入力できるようにした.システムはこれを利用し てユーザ毎の着目度重みパラメータを自動調整するわけである.




 



10. PM評価とコメント


 ユーザの挙動を密かに 観察して,ユーザへのサービスに必要な情報を集めてしまうというアイデアは,ユーザの手を煩わせない究極のヒューマンインタフェースの一つであろう.多 分,有能な秘書はこれをやってくれると,PMは夢見ている.
 大澤君のアイデアは,ユーザが扱ったデータ内容を解析し,データの分類や重み付けを行なう既存の方法と異なり,ユーザの操作履歴情報に基づいて様々な分 析を行なっている点が面白い.そのために,ユーザの操作履歴に基づいてデータ着目度とデータ間関連度という独自の指標を算出している.
 カメラやマイクのついたPCがもう当たり前になってきているので,モニターしている操作や事象をもっと多様なものにし,算出のアルゴリズムをもっときめ 細かくするすると,もっといい結果が出てくるように思う.ともかくその前段階で,まずは使えそうなシステムができあがった.
 こういったシステムの評価は,ユーザインタフェースの善し悪しというか,使いやすさでほぼ決まってしまう.この意味ではまだまだ調整が要る印象がある. 一見,お,これは面白いとみんなに思わせるデモ効果はあるのだが,じっくりと使ってもらえるようにするにはちょっと道のりがある.大澤君もそのあたりのこ とは気がついているので,このプロジェクトのあともさらにシステムに磨きをかけていくことを期待したい.
 本年度は,報告書作成時点でプロジェクト紹介やダウンロードサイトをちゃんと紹介できているプロジェクトが少なかったのであるが,大澤君の俺デスクはま ずその点で抜かりがない.

  http://oredesk.net/  

   

をご覧いただきたい.また,慶應義塾大学のORF (Open Research Forum,11月下旬,六本木ヒルズ) で展示したときに,すでに多くの人の関心を集めたようだ.まだあまり完成度が高くなかった時期だったのにと,つい思ってしまうが,それだけ最初のアイデア が良かったということであろう.ORFでの発表は以下のメディアに紹介されている.

  PC Watch( 写真付き ) http://pc.watch.impress.co.jp/docs/2005/1128/kyokai40.htm

  ITmedia( 文字紹介のみ ) http://www.itmedia.co.jp/enterprise/articles/0511/22/news101.html  

 

  また,俺デスクで学会発表を2件こなしている.ただし,上にも述べたよう にこの段階で留まってしまってはせっかくのアイデアが花開かない.みんなが使ってくれるシステムとして作り上げていくにはもっともっと考えないといけない こと,設計と実装を深めないといけないことがある.それはGUIのほんのちょっとした工夫で爆発的に改善されるような類のもののような気がする.
 幸い,大澤君は作り放しではなく,アピールする機会を捉える積極性がある.プロジェクト期間を過ぎても,PMはいろいろとコメントしていきたいと思う. 行く末が楽しみなシステムだからである.(どうでもいいことだが,「俺デスク」だと女性の受けが悪いと思うのはPMがもうジーサンだからだろうか?)

 成果の露出性と,大澤君のアイデアと積極性を評価して,大澤君には準スーパークリエータの称号を差し上げたい.




  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004