平成12年度未踏ソフトウェア創造事業


採択案件評価書

1.担当PM  8.長谷川 正治
2.採択者氏名  松本 尚 (東京大学大学院理学系研究科・助手/科学技術振興事業団さきがけ研究21)
3.プロジェクト実施管理組織  三菱マテリアル株式会社
4.委託金支払額  18,900,000円
5.テーマ名  ネットワークRAIDファイルシステムの開発
6.関連Webサイトへのリンク SSS-CORE
7.テーマ概要

 LAN接続における分散共有ファイルシステム環境のなかで、比較的遊休資源となっているローカルディスクを有効活用し、低コストで高信頼分散共有ファイルシステムを可能とするネットワークRAIDファイルシステム(NRFS)を開発する。

 従来は、分散ファイルシステムのディスク装置として専用ハードウェアを搭載したRAID装置を導入して信頼性を高める方式が一般的であり、この場合はファイルサーバーに信頼性と性能が要求され、結局システムのコスト高を招く。本提案ではLANに接続されている安価な普及型PCやワークステーションを活用してファイルシステムの信頼性を向上させる方式を開発する。

 今回は、ミラーリング方式を拡張した多数決方式に基づく障害検出訂正方式、ネットワークインターフェースカード(NIC)のチェックサム機能を利用した高速データ認証機能を設計し、公募者が既に開発した通信オーバーヘッドを削減できるMBCFプロトコルを通信プロトコルに採用する事によって高効率高信頼のNRFSを開発する。OSにおける位置付けとしては、NFS (Network File System)を拡張する形で、VFS (Virtual File System)がサポートするファイルシステムの一種類としてOSに組み込んでいく。

 開発対象とするシステムは、公募者が研究開発中のSSS-CORE(汎用スケーラブルOS)および、開発成果をより早く多くの人に活用してもらうためPC互換機のLinuxである。
8.採択理由と期待

高価なRAID装置を購入することなく、低コストでソフトウェアのみの高信頼分散共有ファイルシステムであるネットワークRAIDファイルシステムを使用することにより、貴重なデータの消失防止は勿論、多くのプログラマとエンジニアがディスクトラブルの復旧作業から開放される効果は大きいものがあると考える。

訂正可能な障害はファイルシステムが自動的に修正し、ディスククラッシュのようにハードウェア交換が必要な障害に対しても停止することなく交換作業を行なうことが可能となる。また、マシンレベルの冗長性を備えているため、故障ノードの電源を切断して修理作業を行なってもファイルシステムは運用継続でき、故障ノード通電後、ソフトウェアによって自動的に交換されたディスクのファイルシステムを無故障状態に復帰することが可能となり、ディスククラッシュからの復旧に通常莫大な時間・労力を取られていることを考えるとプログラマ、エンジニアの本業業務への専念という生産性向上への寄与が期待できる。
9.採択時の提案に対する成果進捗に対するコメント

RAIDファイルシステムをネットワーク上に分散するというユニークな発想のもと、短期間のうちにLinuxのソースコードを解析してNFSを拡張し実際に動作するプロトタイプを開発した点は評価できる。ただし開発期間が短かったため、ファイルシステムには最も重要であると思われる障害/例外への対応が十分なされていない。 対応すべき障害/例外の洗い出しから対応策の検討、実装、そしてテスト方法の検討、実施と行わなければならない必須作業項目は未だ膨大であると思われる。 さらに障害からの復旧方法に関しても、現在は特定の障害に対してクライアントソフトウェア側が復旧の指示をだすという実装に留まっている。 利便性などを考慮するとサーバー側だけで障害を監視し自動的に復旧する仕組みも必要ではないかと思われる。
10.成果に対する今後の展望

ベンチマークテストにおいても従来のNFSと遜色のないパフォーマンスが得られることが実証されており、また安価なハードウェアを活用したRAID構成のディスクリソースが容易に利用できるという点から本システムへの需要は高いと予想される。 さらに本プロジェクトではNFSへの拡張という実装方法を採用したため既存のUnix環境への親和性が高く、広く普及するための条件は兼ね備えているといえる。 上述したように充分な障害時対策は必須であるが、同時に配布が容易なパッケージング方法の検討や配布方法の検討も行っていく必要がある。