|
今日のウェブの検索エンジンは、ロボット型検索エンジンが主流である。リンクに重みをおき、そのリンクの構造からウェブページを評価することで、人々は以前よりも円滑に情報を入手することが可能になった。
しかし、ウェブページの検索と比べて、ウェブにあるマイクロコンテンツの検索については精度が低く感じられる。原因は評価の障害となる3つの要因にある。ファイルそのものに外部から直接リンクする行為(ダイレクト・リンク)が一般的ではないこと、alt属性に付与するテキストが限られていること、ウェブページにあるマイクロコンテンツとメタデータとなるテキストの対が機械的に判別しにくい、もしくはXMLデータの手動入力が容易ではないことにある。
これらの要因を踏まえ、より良いマイクロコンテンツの評価と検索の実現を目指すことこそが、本プロジェクトのテーマである。
ブロードバンドの普及、コンテンツ作成コストの低下により、ウェブには検索の対象とされていないマイクロコンテンツが充溢している。このテーマの追尋は急務であり、一つの方向性を示したい。
|