IPA


公募結果一覧へ

 



2007年度第T期 未踏ソフトウェア創造事業  採択案件概要


 




1.担当PM

  畑  慎也 PM (サイボウズ・ラボ株式会社 代表取締役 社長)




2.採択者氏名

開発代表者

大橋  猛 (ソリスアート 代表 )

共同開発者

なし




3.プロジェクト管理組織


  テクノロジーシードインキュベーション株式会社




4.採択金額


  5,000,000




5.テーマ名


  フレームを活用したスクレイピングによるマッシュアップ支援ツール




6.関連Webサイト


  なし




7.申請テーマ概要

 インターネットが始まり様々な情報をWebサイトに載せるようになってから、スクレイピング技術の需要が起きた。天気予報や為替相場、株価などの情報を自動的に取得して、別のシステムでデータとして活用したいと望むのは自然な流れだ。ブロードバンドの普及、軽量スクリプト言語の発明、Ajaxの整備など、いくつかの条件が重なってマッシュアップというのが盛んになってきている。マッシュアップとは、複数のサイトからデータを組み合わせて新しい価値を生み出すことである。

 

 しかし、マッシュアップするためにはWebサイトがRSSWeb APIを提供していないと不自由だ。そこでスクレイピング技術を用いれば独自のAPIを作って、Webサイトにあるデータならばすべて活用できる。ブラウザ上で人が目に触れるものは、システムとしてすべて利用できるようになるだろう。

 

 ただし、独自のAPIを自動で作るようなスクレイピング技術の発展が必須である。このプロジェクトで作成するソフトウェアは、AIで研究されてきたフレーム理論を用いてそのスクレイピングの精度を高めるものである。ソフトウェアは以下のモジュールから構成される。

 ・スクレイピングを行うモジュール

 ・そのスクレイピングを判別するDOM解析

 ・フレーム理論を活用する部分

 ・他のマッシュアップツールと連携を取る部分

 ・Ruby on Railsを活用したGUIによる支援ツール

 

 このソフトウェアが公開されて多くのプログラマーが利用していただければ、各々のサイトに分散されている情報が統合され、インターネット全体を一つのシームレスなデータベースとする一歩になると思う。またキーワードを元にした検索エンジンが普及しているが、その次の課題は情報を理解する意味的ネットワークである。このソフトウェアがその橋渡しの一つとなることを希望する。




8.採択理由

XMLやセマンティック・ウェブなどが叫ばれる中、Web上では様々な事情から構造化されていないデータがまだまだ多いというのが実情である。当然、ユーザーがマッシュアップしたいと考えるWeb上のデータについても構造化されていないもの多い。そこでスクレイピングという技術が必要となるが、スクレイピングによりWeb APIを自動生成し、マッシュアップを支援しようというのが本提案である。インターネット/イントラネットの実情を背景に、様々なWebシステムの連携・統合を可能にするという点で評価できる。



  ページトップへ   

 

 




  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004