平成12年度未踏ソフトウェア創造事業


採択案件評価書

1.担当PM  9.平木 敬
2.採択者氏名  高橋 大介 (埼玉大学大学院理工学研究科・助手)
3.プロジェクト実施管理組織  株式会社三菱総合研究所
4.委託金支払額  12,990,784円
5.テーマ名 「高速化した計算機システムにおける高速フーリエ変換ソフトウェア」
6.関連Webサイトへのリンク
7.テーマ概要

各種数値計算アルゴリズムやメディア処理における中核的数値アルゴリズムである高速フーリエ変換を、並列分散環境で高速実行するライブラリを作成する。作成するソフトウェアは、メモリアクセスを少なくかつ局所化し、通信回数を少なくして1通信当たりのデータ量を多くし、並列性を高くすることを特色としている。

 本申請の、平成12年度末までの短期的な目標は、@高並列システムに適した並列FFTアルゴリズムを作成し、Aいくつかのシステムで性能評価を行うことである。本申請テーマの長期的目標は、並列分散システムにおける最速かつ汎用のFFTライブラリを構築することである。
8.採択理由

上記テーマは、下記観点から未踏ソフトウェア創造事業に適すると判断し、採択が適当であると判断した。

テーマ内容が本PMが取り扱う未踏ソフトウェア創造募集分野に合致する
提案内容の基礎となる理論、技術やアイデアが明確である
提案内容の実現方法、実施体制、スケジュールが具体的であり、妥当性がある
提案内容は、提案者以外では達成困難である等、未踏ソフトウェアの範疇に含まれる


申請テーマの評価:


1.基礎となる理論、技術、アイデア


 申請のソフトウェアは、まだ計算機能力、メモリ容量が非常に小さい時期に生まれた Out of Core法に基づくものであり、現在主流となっている方法とは異なる。従って、高並列分散環境における振る舞いに関しては未知の部分が多いが、可能性は高いと評価した。


2.実現方法、実施体制、スケジュール


 申請者は、既にFFTライブラリに関して、アルゴリズムはことなるが優れた実績を持ち、競合する既存ライブラリと比較して良い結果を出しているとともに、いくつかの論文発表を行っている。従って、申請者が非常に優れたソフトウェア開発能力をもっていることはある程度客観的に示されている。また、コード量よりは、アルゴリズム、細かなチューニングが問題となるライブラリ開発では、提案にあるように個人で開発することが適していると判断した。


実施体制に関して、申請者は SR-8000 を代表とする高並列型のスーパーコンピュータを開発プラットホームにすることを前提とした。開発するFFTライブラリの超高速性を実証するためには、現在最速の計算機の一つであるSR-8000をプラットホームにする意義はあるが、SR-8000の設置台数を考慮すると、より広く使われる形態でのソフトウェア開発が望ましい。


3.提案者以外では達成困難である等、未踏ソフトウェアの範疇に含まれるか


申請者の過去のソフトウェア/アルゴリズムの開発実績、提案アルゴリズムの概要を考慮すると、開発する高並列システム用FFTライブラリが将来クラスタ計算機環境および高並列スーパーコンピュータ利用者にとって、第一選択のライブラリとなる可能性が高いと判断した。多くの数値計算ライブラリを海外研究者に開発されたものに依存している我が国の現状を鑑みると、これは未踏ソフトウェアの範疇に含まれると考えられる。


申請内容の持つ問題点:


既に示したように、高並列環境において高性能FFTを必要とする研究者/ソフトウェア開発者にとって第一選択であるFFTライブラリを作成するためには、高並列スーパーコンピュータを対象とするだけでは著しく不十分である。高速性の実証と、普及のための方法は同時並行的に扱うことが必要である。


次に、開発環境が1台のパーソナルコンピュータに限定されていることが本開発の成果の普及にとって障害になることである。優れたアルゴリズムが広く普及するライブラリとして使われるためには、性能評価時だけでなく開発の全期間に渡って実際に使用する環境に近い環境を用いることが強く望まれる。



コメント:

1.本申請は、順調に開発が進めば、世界のトップレベルのFFTライブラリになる可能性を持っている

2.従って、今年度の開発により、何らかのメジャーで世界一の性能を持つことが求められる

3.Cluster 環境の重要性を正しく認識する必要がある

4.ライブラリ速度の達成度により、来年度以降の取り組みを判断する
9.開発目的・目標

各種数値計算アルゴリズムやメディア処理における中核的数値アルゴリズムである高速フーリエ変換を、並列分散環境で高速実行するライブラリを作成する。作成するソフトウェアは、メモリアクセスを少なくかつ局所化し、通信回数を少なくして1通信当たりのデータ量を多くし、並列性を高くすることを特色としている。

本プロジェクトの目標は、1)高並列システムに適した並列FFT アルゴリズムを作成し、2)いくつかのシステムで性能評価を行うことである。

FFTを実現する方式は、まだ計算機能力、メモリ容量が非常に小さい時期に生まれた Out of Core法に基づくものであり、現在主流となっている方法とは異なる。従って、高並列分散環境における振る舞いに関しては未知の部分が多いが、高並列分散環境において実際に高速性を発揮することが目標である。

なお、本件については、採択に際して次の点をコメントしている。


(1)本申請は、順調に開発が進めば、世界のトップレベルのFFTライブラリになる可能性を持っている

(2)従って、今年度の開発により、何らかのメジャーで世界一の性能を持つことが求められる
10.開発評価


(成果)

クラスタ計算機環境における並列FFTライブラリを実現するために、


・単一プロセッサにおけるブロックにおけるsix-stepFFTアルゴリズム

・単一SMPノードにおける並列一次現FFTアルゴリズム

・クラスタ計算機環境における、nine-stepFFTに基づく並列一次元アルゴリズム


を提案するとともに実現した。

また、高並列スーパーコンピュータにおける並列FFTライブラリを実現するために、


・five-stepFFTアルゴリズムに基づく並列一次元FFTアルゴリズム


を提案するとともに実現した。そして、これらのFFTライブラリについて、速度評価が行われた。この結果、現在多く用いられている高速FFTであるFFTWと比較して、安定してより高速であるとの評価を得た。成果報告書に述べられている評価は、ある一定の環境のもとの評価であることから、今後、さらに詳細な評価を行う必要はあるものの、世界で最も高速なFFTライブラリ群の一つであることは事実であると判断した。



(今後の課題)

本プロジェクトの範囲内においては、一定の成果をあげることができた。

しかし、次の課題を指摘することができる。


・評価環境の拡大と多様化

・より多くの高速FFTライブラリとの相互比較

・ライブラリが持つ性質の精密な解析

・更なる高速化と、小型化


このように、本テーマは当初予測した成果は達成したものの、多くの未解決点を持ち、平成13年度以降にプロジェクトを継続する意義が大であると判断する。