IPA


IPAトップ





2005年度未踏ソフトウェア創造事業(未踏ユース)  採択案件評価書


 



1.担当PM


 竹内 郁雄   (東京大学大学院教授)



2.採択者氏名


 代表者

荒川 豊(慶應義塾大学 大学院 博士課程)

共同開発者

清水 翔(慶應義塾大学 大学院 修士課程)
立野 雅紘(慶應義塾大学 理工学部)



3.プロジェクト管理組織


 株式会社オープンテクノロジーズ


4. 委託支払金額


 2,993,823円



5.テーマ名


 対話型Blogシステム



6.関連Webサイト


 なし



7.プロジェクト概要


 近年,誰でも簡単に インターネット上で情報発信可能なweblog (以降,Blog) が広まっている.日本ではすでに開設者335万人,閲覧者1651万人に達しており,2007年には開設者782万人に達すると予想されている.
 しかしながら,申請者をはじめとして,Blog開設者の多くが継続的な更新の難しさに直面している.Blogではトラックバックやコメントなど,開設者 と閲覧者のコミュニケーション手段が用意されていることが特徴の一つであり,それが更新の原動力となると考えられる.しかしながら,大手Blogサイトで は個人的なBlogが有名なBlogに埋没してしまい,大半の人のBlogは読まれていないというのが現状である.
 そこで,本提案では,ニュースなどのトピックを元に「ネタ」を生成し,個人の興味に応じて,Blog側からネタを配布する.ユーザはそれに返事すること により,継続的な更新が可能となる.また,Blogとメーリングリストを融合し,同じネタに返事した人が,開設者=閲覧者となるような仕組みとすること で,個人のBlogの活性化を図る.提案システムにより,メル友とコミュニケーションする感覚で楽しくBlog更新ができることが期待される.また,複数 のユーザに同一の質問することにより,Blogを使ったアンケート的な利用もできると考えられる.
 本システムは,既存のBlogシステムを利用するためのBlogツール的な位置づけであり,ユーザとBlogサーバの仲立ちをする.具体的には,以下の ように動作する.システムがそれぞれのユーザの興味にあった質問文を生成し,メールを使って送付する.その返信を受け,Webリソースを取り扱うためのプ ロトコルであるAtomAPIを用い,Blogサーバにアクセスして代理更新を行なう.本プロジェクトにはBlogサイトの構築は含まない.既に多数に利 用されているシステムが存在し,新たに構築する必然性がないからである.




8.採択理由


 blog流行りである が,本当の意味でアクティブにblogをやっている人は一握りの人だという.荒川君の提案は,竹内に言わせると「無理矢理blog」で,システムからいろ んな問いかけをするようにして,多くのblogユーザとコミュニティを活性化させるアイデアである.うーむ,こうまでして,という気もしないでもないが, これもITによるコミュニティ支援であろう.技術的にも機械が自動的にユーザに対する質問等を投げかけるところなどは挑戦的である.



9.成果概要


 対話型Blogシステ ムとは,サーバからのPush型ネタ配信と,メーリングリストを組み合わせた,Blog更新促進システムである.サーバは,インターネットから収集した情 報と,ユーザの過去の返信履歴を学習し,ユーザが興味を持つと思われるネタを,メールで必要なユーザのみに配信する (図2.1.1 サーバがニュースから話のネタを選んで,興味をもちそうなユーザにのみメーリングリストで話題を配信する).
 ユーザはこのようにして送信されたメールに対して,返信するだけで自分のBlogを更新できると同時に,同じネタが配信された他のユーザに対して,自動 的に自分の意見を伝えることが可能となる.返信するだけで自動的に自分のBlogを (代理) 更新してくれたり,自動的にバックトラックしてくれるのはMLOGと名付けたサーバである.これにより,既存のトラックバックだけで得られない豊かな,つ ながりやすいユーザ間コミュニケーションを構築することができる.
 本システムは,ネタおよびメールに関するさまざまな機能を有するMLOGサーバを中心とした,図2.1.2対話型Blogシステムの全体構造に示すよう な構成となる.ユーザはあらかじめ,メールアドレス情報,Blog情報などを登録しておくことで,ネタ配信サービスとメールによるBlogの代理更新サー ビスを利用することが可能となる.
 ネタに関しては,ネタの自動生成,ネタの自動マッチング,ネタの配信,返信の分析などがある.また,Blogの代理更新に関しては,Blogの外部から の更新,トラックバック送信,携帯電話への対応,複数Blogへの対応などがある.さらにメールに関する処理として,メーリングリストの自動生成,管理な どがある.これらの連携に関して,図2.1.3 ネタ生成から,Blogユーザ同士がつながっていく流れの例に,MLOGと,ユーザA,ユーザBの動作の流れと処理フローを説明しておく.
   図2.1.1    図2.1.2

図2.1.1 サーバが興味を持ちそうなユーザに話題を配信      2.1.2 対話型 Blog システムの全体構造

 
    図2.1.3

           図2.1.3 ネタ生成から,Blogユーザ同士がつながっていく流れの例

                                              

                                            

  @【MLOG】ネタ生成,メーリングリスト生成,メール配信,管理者 Blog更新
  A【ユーザA,ユーザB】メール受信
  B【ユーザA】メール返信
  C【MLOG】メール受信,ユーザAのBlog更新,管理者Blogへトラックバック
  D【ユーザA,ユーザB】メール受信
  E【ユーザB】メール返信
  F【MLOG】メール受信,ユーザBのBlog更新,管理者BlogとユーザAのBlogへトラックバック

 

   開発にはVine Linux 3.2,MySQL 4.0.25,Postfix 2.0.25,Ruby 1.8.2,Apache 2.0.50,PHP 4.4.1を用いた.本システムの各モジュール間の情報の受け渡しは基本的にデータベースを用いる.そのために本システムでは,MySQL 4.0.25を用いた.データベース内で用いる文字コードはUTF-8とした.
 MLOGによって自動更新が行なえるBlogは,SeesaaBlogとLivedoorBlogである.SeesaaBlogへの投稿を実装したクラ スではXML-RPCを利用し,LivedoorBlogへの投稿を実装したクラスでは,PHPで実装されたAtomAPIを利用した.
 本システムでは,新たなネタが配信されるたびに新たなメーリングリストが生成される仕組みになっている.本システムはMTAとしてPostfixを使用 しており,各メーリングリストのアドレスはPostfixのメールエイリアス機能を使用する.ネタが生成されるたびにメールエイリアスが追加され, newaliasesを実行することで,Postfixに設定の変更が反映される仕組みとなっている.
 なお,本システムでは,ネタごとに配信ユーザが決まるのではなく,メールごとに配信ユーザが対応するようになっている.すなわち,メールを受信すると, そのメールに対してユーザの嗜好を示すキーワードとのマッチングを行ない,適合するユーザを配信対象ユーザとする.これによってよりきめ細かいコミュニ ティ作りを狙える.

 ネタに関しては,(1)自動生成,(2)手動生成,(3)ユーザ提供の3つの手法が考えられる.当初,(1)を目標としたが,自然言語処理の難度が非常 に高く,開発期間内での実装が困難であったため,(2)を適用することにした.ただし,すべてを管理者が考えることは無理なので,手動生成時の補助機能と して,インターネット上で話題になっているニュースを抽出するスクリプト「ネタ帳」を作成した.ネタ帳では,RSSでニュースサマリを提供している多数の ニュースサイトを巡回し,取得ニュースを分析する.RSSに対応していないサイト,たとえばGoogleニュースなどは,独自にそれらをRSS化している サイトや,現存するRSS化ツールを経由して取得した.
 ネタの題名,本文を送信すると,そのネタの特徴となるキーワードを設定し,配信するユーザを選択する.キーワードは形態素解析器MeCabを用いて抽出 され,設定される.なお,投稿者 (管理者) は,フォーム上で結果のキーワードの追加・削除を行なうことができる.
 ネタを配信する対象となるユーザは,ネタに設定されたキーワードとユーザに設定されたキーワードのうち共通するキーワードが閾値を超える場合に選択され る.また,投稿者は配信するユーザを自由に追加することができる.各ユーザの興味キーワードは過去の返信歴から学習される.ただし,共通するキーワードか ら配信するユーザを選択する機能は,現在未実装であり,今後の課題である.
 ネタ投稿者に対して,有用なニュース情報を提供するために,ニュースランクを算出する.ここでは多数のニュースサイトで掲示されているニュースほど,注 目度が大きいニュースと定義し,それをニュースランクという値で算出する.ニュースランクを出すために,ニュースに含まれるキーワードの重みを用いる.
 ニュースランクは,ニュースに含まれるキーワードを抽出し,それぞれのキーワードランクを総和したものとする.つまり,キーワードランクの高いキーワー ドを多数含むニュースほど,ニュースランクが高くなる.以下に最近の典型的な例を示す.ここではランクの高くなってしまう一般語の排除が問題となった.

   

   

       ニュース: 民主党,ライブドア事件で,引責問題へ
  キーワードランク: 6    1    6    5
  ニュースランク: 6+1+6+5=18
                         
 本システムにより,これまでになかったBlog間の連携が生まれ,Blog全体の活性化が促進できると同時に,ユーザの恒常的なBlog更新の手助けに なると思われる.



 



10. PM評価とコメント


 荒川君たちは異なる テーマで2件の提案をしてきた.もう1件のほうはP2Pによる次世代インターネットコンテンツの配信というもので,オンデマンド型のコンテンツ配信ではな く,ブロードバンドのP2Pを使っていわばバックグラウンド的にコンテンツを能動的に,つまりpush型で配信してしまおうというようなアイデアであっ た.
 このアイデア,つまりpush型で無理矢理情報を配信するという考え方は,ここで提案されている対話型Blogにも共通するものがある.PMが採択理由 でも書いたように,これは,自分のアクションが報われないので眠ってしまったようなBlogユーザを叩き起こす「無理矢理Blog」である.たしかに名目 上のBlogユーザの数は非常に大きいがほとんどのBlogユーザが休眠しているとすると,本来のBlogではなくなるのかもしれない.もっとも,逆に情 報発信が完全に自由市場になったときの,壮大な情報社会の実験が行なわれていると言えないことはない.つまり,放っておくとBlog文化はある均衡点に達 するからそれでいいのだという考え方もあると思う.
 しかし,それをエンジニア魂をもって,カンフル剤を打ち続けようと荒川君たちは考えた.同じ研究室の学生3人とはいえ,年代がまるで違う3人の共同作業 はそれほど容易ではなかったと思われる.システムはモジュール分けされていて分担開発はしやすそうだったが,完成に向かう必然的な順序というものがあり, それがスムーズに流れていたとは思えないところがある.そもそも,リーダーの荒川君はこの開発テーマとはほとんど無関係な博士論文の仕事にかなりの時間を 取られた.しかし,一番忙しいときに,別の開発を増やすという心意気は高く買える.
 このシステムの狙いは「無理矢理Blog」であるが,いかんせん,現状ではシステム管理者の負担が大きすぎる.ネタの自動生成は結局計画に及ばなかった し,メーリングリストの作成も現状ではほとんどが管理者の手動作業による.少なくとも後者が相当に自動化されないと,このシステムの世の中への展開は難し いだろう.しかし,それを逆手に取って,同志社の宮崎君たちのイントラブログに似たシステムへ展開してしまうアイデアがあるかもしれない.
 とはいえ,このプロジェクトの開発成果の肝は,メールへの返信で個々人のBlogが自動更新されるというメカニズムをきちんとつくりあげたことであろ う.2種類のプロトコルに対応し,SeesaaやLivedoorのBlogユーザが使えるようになったことは評価される.MLOGは,まだまだ改良点は あるにしても,システムとしてある程度の完成度はある.
 荒川君たちも認めているように,今後の課題は数多い.その中で,最も大きいものは,ネタの自動生成部および,ネタに対するユーザの自動マッチングであ る.登録ユーザ数が多くなればなるほど,自動マッチングが重要となる.さらに,ユーザ毎の設定 (メールの受信やネタの内容など) を充実させることにより,自動マッチングの精度をあげることも重要である.
 もう一つの課題として,メーリングリストに関するものがある.たとえば,どのセッションまでメールを送るか,ユーザがこのメーリングリストから途中で抜 けたい場合はどうするのか,など.荒川君たちが言うように,ネタの生成と,Blogとメーリングリストの融合部を切り分け,特に (ある程度完成度の高い) 後者を何かのシステムに応用できないかと考えることは良い方向だと思う.
 いずれにせよ,単にシステム屋的発想だけでは対処できない自然言語処理の難しさを実感したことは,今後のシステム開発の経験として貴重であった.荒川君 は本業のほうでしっかりとした業績を上げ,慶応大学にそのまま残ると聞いている.やり残したことを少しでも潰して,完成度を上げ,システムの部分モジュー ルだけでも,世の中で使われるようなものにしてほしい.


  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004