| 
本プロジェクトは、様々な人々がウェブ上で日記や雑記録として利用しているblogを、掲示板やBBSと同様の情報源として定期的に監視し、その記録から興味深い情報を抽出するためのシステムの開発を目指している。本システムは以下に示す3つの機能を持つモジュールから構成される。
1) blogページとして監視するべきURLの特定,自動収集
典型的なblogページの特徴パターンを利用して,WWW上をクローリングすることで得られたページ集合から,blogページのみを選択的に自動収集する.
2) blogページの定期的監視
定期的に収集したblogページ集合を監視し,更新された部分のみを抽出する.
3) 内容に基づく分類,テキストマイニング
2)で収集したblogページ(の更新部分)を,内容を元にグループ化し分類する.分類したblogページ集合ごとに,テキストマイニングを行い,
有用な情報を抽出,発掘する.

|