デジタル人材の育成

未踏IT人材発掘・育成事業(本体):2009年度下期採択プロジェクト概要(岡PJ)

1.担当プロジェクトマネージャー

勝屋 久(Venture BEAT Project主宰)

2.採択者氏名

  • チーフクリエータ
    岡 瑞起(東京大学 知の構造化センター・特任研究員)

  • コクリエータ
    なし

3.未踏プロジェクト管理組織

  • 株式会社京王ITソリューションズ

4.採択金額

  • 5,000,000円

5.テーマ名

  • ウェブデータからの行為抽出エンジンの開発

6.関連Webサイト

  • http://pingpong.ne.jp

7.申請テーマ概要

Facebook、Twitterといったソーシャルネットワークサービスや、ブログやマイクロブログといったコミュニケーション手段の普及により、 誰でも気軽に情報を公開、共有できるようになっている近年、さまざまなユーザが、製品やイベントに対しての嗜好や意見、また、日常の行動などについて発信している。その結果、年々企業側が提供する製品に関する情報よりも、これらのコミュニケーション手段を通じてユーザが発信するコンテンツ(User Generated Contents, 以下、UGCs)が、消費者の購買行動に影響を与えるようになってきていると言われている。このような背景の中、UGCsから自動的に注目の話題を抽出したり、製品やブランドに関する評判を分析するサイトやシステムが開発、公開されている。このようなさまざまなコミュニケーション手段を通じて発信されるUGCsから抽出可能な情報は、製品や出来事に対するユーザの意見、評判といったものに限らない。Twitterのサイトにおいて「いまなにしてる?」という問いかけに代表されるように、UGCsには多くの行為を含むデータが蓄積されている。

本プロジェクトは、ウェブから人々は何をしているのかを知ることを通じて人間の英知を集め、有効的に活用するシステムの開発を行う。具体的には、ウェブ上で、さまざまな人がブログやマイクロブログといった新しいコミュニケーション手段を通じて発信しているデータを収集し、これまでに開発・研究されてきているウェブマイニング技術と自然言語処理技術を用いて、誰が、いつ、どこで、何に対して、何をしたか、を集めた行為データベースを構築する。さらに、このデータベースを活用した行動パターンの可視化や、行動予測を行うウェブ上のサービスとして提供する。提供するサービスの情報を用いることにより、新しい情報環境のデザインなど、さまざまな分野のサービスをデザインするツールとして大きく貢献できると考える。

8.採択理由

Twitter, Blog, mixi, Facebookなどから情報抽出し、Webマイニング技術と自然言語処理技術を用いて人の行為を抽出するエンジンを開発することがテーマである。今回の開発をとおして、自然言語処理の要素技術で難しいとされている含意・言い換えの問題と事実性判定の問題を解き、大量の情報を解析するソフトウエア開発という高い目標にチャレンジをする岡さんの情熱と志を感じた。webマイニングの研究経験とGoogleやMicrosoft Reseachなど海外でのインターンシップの経験もあり、グローバル視野をもつ人材としても今後期待できる。この期間中はTwitterにフォーカスして開発して、実用化を前提に取り組んでほしい。