デジタル人材の育成

未踏IT人材発掘・育成事業:2018年度採択プロジェクト概要(河田・稲垣PJ)

1.担当プロジェクトマネージャー

  • 首藤 一幸(東京工業大学 情報理工学院 准教授)

2.採択者氏名

  • 河田 旺(京都大学 大学院 情報学研究科 通信情報システム専攻)
  • 稲垣 悠一(京都大学 大学院 情報学研究科 通信情報システム専攻)

3.採択金額

  • 2,304,000円

4.テーマ名

  • 分野限定型検索エンジンを複数組み合わせた分散型検索エンジン

5.関連Webサイト

  • なし

6.申請テーマ概要

検索エンジンはインターネットのインフラである。世界中の人々が検索エンジンを利用し、その検索結果を信用している。そのため検索エンジンには透明性が求められる。しかし現在広く利用されている検索エンジンは民間企業が作成したものであり、検索アルゴリズムが非公開で透明性に欠ける。そこで、透明性が保証された検索エンジンを作るために分散型検索エンジンが開発された。分散型検索エンジンでは検索エンジンのデータベースをネットワーク上に分散して保持する。データベースを分散させることで巨大なデータセンターが必要なくなり、資金のないオープンソースプロジェクトでも検索エンジンを実現することができる。オープンソースプロジェクトなので検索アルゴリズムが公開されており透明性が保証されている。しかし分散型検索エンジンは民間企業のものに比べてその検索結果の品質が劣る。これは全インターネットを対象とするために必要なマシンリソースが、ネットワーク上の善意の提供者のものだけでは不足することが一因である。
この問題を解決するために、本プロジェクトでは新しい分散型検索エンジンの方式を開発する。本プロジェクトの方式では検索エンジンのデータベースを分野ごとに分割して保持する。分野はある分野の検索エンジンを構築するユーザが、その分野に関連する単語や、文書を与えることで定義する。分野を分割することでマシンリソースを集中的に投入でき、また情報収集の際に関連する単語や文書の情報が使える。その結果、その分野の検索結果の品質が向上する。更に本プロジェクトでは複数の分野を統合するソフトウェアも提供する。本ソフトウェアを使えば、広い分野をカバーするための検索エンジンをボトムアップ方式で構築することが可能になる。結果として限定した分野においては従来よりも精度の高い分散型検索エンジンが実現できる。

7.採択理由

オープンなウェブ検索エンジンを開発する提案である。ここで、オープンとは、ランキングの方式が公開されていて、検閲が困難で、誰でも立ち上げが可能であることを指す。ここまでは既存のソフトウェアも存在するが、ある種のアイディアで、高い精度と性能、扱いやすさを目指す。
新規性が高いわけではないが、しかし、河田君と稲垣君の腕と意欲は確かで、また、上記「オープン」に対する信念は信じられる。2人が世に一石を投じることは確かだが、そこで満足しないで「オープン」検索エンジンを世界中に広めてくれることを期待する。