デジタル人材の育成
石川 裕(東京大学大学院 情報理工学系研究科 教授)
チーフクリエータ
山田 浩之(株式会社メタキャスト 開発部)
コクリエータ
なし
近年、ハードディスクの大容量化、低価格化に伴い、ウェブサービスは大量のデータを保持するようになってきています。それを支えるシステムとして、リレーショナルデータベースや検索エンジンなどがあり、それらはウェブサービスの開発には必須のものとなりつつあります。一般ユーザを対象としたウェブのサービスの開発では、オープンソースのシステムを効率的に利用することにより、サービスやビジネスなどのより本質的な部分に注力することが可能となってきています。そのような開発において、オープンソースのリレーショナルデータベースではMySQLがデファクトスタンダードとなっていますが、検索エンジンに関してはどれも一長一短であり、主な原因としてスケーラビリティへの配慮が足りないことが挙げられます。そのような背景から、よりスケーラビリティを考慮した高性能な検索エンジンがオープンソースで開発されることが期待されています。
本プロジェクトでは、大規模なデータに対して効率的に情報を取り出すことを可能にする全文検索エンジンの開発を提案します。現在私が開発中のオープンソース全文検索エンジンLuxをベースに、単一マシン上での検索エンジンとしての基本機能の充実・性能向上に加えて、複数台マシン上にスケールアウトするための分散インデックスをサポートする機能を組み込むことを目指しています。また、業務・個人で多数の検索エンジンを使ってきた経験を基に、使い易さにも重点を置いて開発していきたいと考えています。
本提案では、提案者が開発したLux全文検索エンジンを分散化するとともに検索機能を強化する。LuxはC++で記述されており、拡張性、カスタマイズにも配慮した構造となっている。目標とする処理能力について精査する必要があり、また、分散化におけるネットワークプロトコルおよび実装については今後の検討が必要であるが、全体としてよくまとまっている。今後に期待できる提案であり採択しました。