デジタル人材の育成

未踏IT人材発掘・育成事業(本体):2008年度上期採択プロジェクト概要(山田PJ)

1.担当プロジェクトマネージャー

石川 裕(東京大学大学院 情報理工学系研究科 教授)

2.採択者氏名

  • チーフクリエータ
    山田 浩之(株式会社メタキャスト 開発部)

  • コクリエータ
    なし

3.未踏プロジェクト管理組織

  • 株式会社メルコホールディングス

4.採択金額

  • 6,000,000円

5.テーマ名

  • 全文検索エンジンLuxの開発

6.関連Webサイト

  • http://luxse.sourceforge.net/

7.申請テーマ概要

近年、ハードディスクの大容量化、低価格化に伴い、ウェブサービスは大量のデータを保持するようになってきています。それを支えるシステムとして、リレーショナルデータベースや検索エンジンなどがあり、それらはウェブサービスの開発には必須のものとなりつつあります。一般ユーザを対象としたウェブのサービスの開発では、オープンソースのシステムを効率的に利用することにより、サービスやビジネスなどのより本質的な部分に注力することが可能となってきています。そのような開発において、オープンソースのリレーショナルデータベースではMySQLがデファクトスタンダードとなっていますが、検索エンジンに関してはどれも一長一短であり、主な原因としてスケーラビリティへの配慮が足りないことが挙げられます。そのような背景から、よりスケーラビリティを考慮した高性能な検索エンジンがオープンソースで開発されることが期待されています。
本プロジェクトでは、大規模なデータに対して効率的に情報を取り出すことを可能にする全文検索エンジンの開発を提案します。現在私が開発中のオープンソース全文検索エンジンLuxをベースに、単一マシン上での検索エンジンとしての基本機能の充実・性能向上に加えて、複数台マシン上にスケールアウトするための分散インデックスをサポートする機能を組み込むことを目指しています。また、業務・個人で多数の検索エンジンを使ってきた経験を基に、使い易さにも重点を置いて開発していきたいと考えています。

8.採択理由

本提案では、提案者が開発したLux全文検索エンジンを分散化するとともに検索機能を強化する。LuxはC++で記述されており、拡張性、カスタマイズにも配慮した構造となっている。目標とする処理能力について精査する必要があり、また、分散化におけるネットワークプロトコルおよび実装については今後の検討が必要であるが、全体としてよくまとまっている。今後に期待できる提案であり採択しました。