アノテーションデータとは,メタデータと同様にコンテンツに関する内容を別に記述したデータのことをいう.人間が生成,理解及び活用することを主目的とするものであり,計算機による意味理解を視野に入れたデータ構造にする必要はない.そういう意味で,計算機の意味理解を一義として付与するメタデータとは性質を異にする.
アノテーション技術の発展により任意の種類のデータやエンティティを対象とした,機械翻訳,情報検索,自動要約,質問応答,知識発見システムなどの実用化や,より高度なデータの加工提示や情報共有が可能となり,その有用性は計り知れない.またアノテーションとはその情報を他人が利用して初めて価値があるものであり,アノテーション情報共有のためのフレームワークの構築が望まれる.そこで本プロジェクトでは,アノテーションの概念に基づく高度情報共有・処理環境の実現を目的とした応用システム構築の上で有用となるライブラリ及びコンポーネントを実装する.
・アノテーションデータをオブジェクト化し,管理,共有するためのアノテーションサーバ
・様々な形態のアノテーションデータに対して,自然言語処理を基軸とした処理を可能とするアノテーションライブラリの構築
・アノテーションデータ群の情報可視化による発想支援,アノテーション生成支援,協調作業及びユーザ主導の各種処理(検索・要約・関連情報提示等)を実現可能とするコンポーネント

|