IPA


開発成果一覧へ





2005年度上期 未踏ソフトウェア創造事業  採択案件評価書




1.担当PM

   高田 浩和 (株式会社ルネサステクノロジ システムコア技術統括部 CPU開発第二部)



2.採択者氏名


開発代表者

濱田 剛  (独立行政法人 理化学研究所 戎崎計算宇宙物理研究室 技術員)

共同開発者

中里 直人 (独立行政法人 理化学研究所 戎崎計算宇宙物理研究室 研究員)


3.プロジェクト管理組織


  有限会社 高速計算機研究所



4.委託金支払額


  14,300,000



5.テーマ名


  リコンフィギャラブルスーパーコンピューティング環境



6.関連Webサイト


  http://progrape.jp/



7.テーマ概要


 
本プロジェクト「リコンフィギャラブルスーパーコンピューティング環境」は、昨年度の未踏ソフト・プロジェクト「ハードウェア自身を再構成する数値計算アクセラレータ用コンパイラの開発」の発展である。
 昨年度はFPGAを物理シミュレーションに利用するための中核となるツールPGR (Processor Generator for Reconfigurable System)を開発することに成功した。PGRコンパイラを使用することにより、デスクトップPCとFPGAボードからなるFPGAベース計算エンジン(FPGA-Based Computing Engine; FBCE)上で、200GFLOPSを超える数値演算シミュレーション性能を実現することが可能となった。
 今年度は昨年度の成果をさらに発展させ、以下の4項目を実現する。
  1. より多くの市販FPGAハードウェアへのPGRの対応
  2. 低コストPGRリファレンスハードウェアの開発
  3. 異機種FPGAハードウェア混在システムへのPGRの対応
  4. FPGAによるテラフロップス級システムの実現



8.採択理由


 
申請者のグループは、昨年度の未踏ソフト・プロジェクトにおいて、FPGAを用いたリコンフィギュラブル・ハードウェアのためのFPGAシステム用コンパイラをすでに完成させており、FPGAボードを用いた数値シミュレーションで100GFlopsを超える性能を実現するなど、画期的な成果を出している。
  申請者らの提案するFPGAを用いたリコンフィギュラブルシステムは、専用ハードウェアやスーパーコンピュータでしか実現できなかった数値演算性能を、卓上のPCとFPGAボードで実現することを可能にしており、今後さらにクラスタシステムへと発展させることで、数値計算の分野で革命を起こすほどのインパクトをもつ可能性がある。昨年度に引き続き、2回目の応募であるが、今回は昨年度のプロジェクトをさらに発展させ、実用化・事業化に近づけることが大きな目標の一つとなっており、これが普及した場合のインパクトの大きさを考え採択することとした。 



9.開発目標


 1. より多くの市販FPGAハードウェアへのPGRの対応
  世界中に存在する既存のFPGAハードウェアをより多くサポートする。
 2. 低コストPGRリファレンスハードウェアの開発
  超低コストPGRリファレンスハードウェアを開発して、リコンフィギャラブルシステムをユーザにとってより身近なものにする。
 3. 異機種FPGAハードウェア混在システムの開発と、テラフロップス級システムの実現
  複数ハードウェアが混在したFPGAクラスタシステムを単一のPGR言語でプログラミング可能にし、
FPGAクラスタシステムでテラフロップス級のリコンフィギャラブルシステム(ヘテロジーニアス・リコンフィギャラブル・スーパーコンピューティングシステム)を世界に先駆けて実現する。



10.進捗概要


 学会・イベントでの成果発表について示す。


年月
発表内容 場所
3月29日 FPGAを用いた再構成可能な計算機による天体物理シミュレーション I, II 日本天文学会2005年春季年会 @東京都日野
4月17日 Astrophysical Hydrodynamics Simulations on a Reconfigurable System IEEE Symposium on Field-Programmable Custom Computing Machines (FCCM'05) @ CA, USA
4月17日 Massively Parallel Processors Generator for Reconfigurable System IEEE Symposium on Field-Programmable Custom Computing Machines (FCCM'05) @ CA, USA
5月13日 物理計算のための並列リコンフィギャラブルシステムの開発 電子情報通信学会 リコンフィギャラブルシステム研究会
@ 京都大学百周年時計台記念館国際交流ホールII
7月18日 Introduction of Processors Generator for Reconfigurable System GRACE Workshop @ Heidelberg, Germany
7月18日 Astrophysical Simulations on Reconfigurable Hardware GRACE Workshop @ Heidelberg, Germany
7月25日 Specifications for the development of PROGRAPE-4 FPGA-board Mannheim meeting @ Mannheim, Germany
8月25日 PGR: A Software Package for Reconfigurable Super-Computing The 15th International Conference on Field-Programmable Logic, Reconfigurable Computing, and Applications (FPL2005)@ Tampere, Finland
9月5日 再構成可能な集積回路による天体物理学計算 日本流体力学会年会2005講演会 @ 工学院大学
9月21日 FPGAによる粒子シミュレーションの高速化 日本機械学会2005年度年次大会 @ 電気通信大学
10月4日 A Software for Many-Body Simulations with FPGAs クレイ・ジャパン第2回Cray HPC カンファレンス 招待講演
@ 東京 大手町サンケイプラザ 会議室 3F 311,312
10月28日 Reconfigurable Super-Computing環境 関西オープンソース2005 @ 大阪産業創造館
11月15日 A 236 Gflops Astrophysical Simulation on a Reconfigurable Super-Computer SuperComputing 2005 (SC|05) @ Seattle, USA
12月1日 PGRのためのPCI-Expressモジュールの実装と評価 電子情報通信学会 リコンフィギャラブルシステム研究会 @ 北九州国際会議
1月17日 FPGAによる流体シミュレーションの高速化 電子情報通信学会 リコンフィギャラブルシステム研究会 @ 慶応大学
1月19日 FPGAによる天体物理学計算の高速化 HPCS2006 @ 東京大学




11.成果


 1. より多くの市販FPGAハードウェアへのPGRの対応
 PGRではハードウェアごとの違いを吸収するためにハードウェア抽象化層を定義することで、各種ハードウェア環境に対応することができる。
 今回、以下の6種類のハードウェアについて、PGRの抽象化層を対応させた。
   ● Bioler3: 理化学研究所と千葉大学で共同開発した遺伝子パターンマッチング用ハードウェア
   ● MPRACE-1: 独Mannheim大学で開発されたFBCE
   ● Cray XD1: CRAY社から市販されているFBCE
   ● PXPDKSXGX40: PLD Application社から販売されているPCI-Expressカード型のFBCE
   ● SGI RASC: SGI社が開発したFBCE
   ● Mappi-2/3: ルネサステクノジ社の開発したFBCE
   ● PROGRAPE-4: 本プロジェクトで開発したFBCE

ただし、SGI RASC、Mappi-2/3については、今回の未踏開発期間中にPGRのサポートを完了し、FBCEの動作を確認することまではできなかった。
 ちなみに、この中でMappi-2/3だけが、それ自体スタンドアロンでLinuxが動作する組み込み環境開発用のFPGAボードとなっている。
 
 2.低コストPGRリファレンスハードウェアの開発
 PGRを普及させるには、安価で高性能なFBCEを実現することが不可欠となる。そこで、本プロジェクトでは、既存のFPBAボードより10倍以上低コストにもかかわらず、PCの100倍程度の演算性能を備える、極めて高いコストパフォーマンスをもつFPGAハードウェア「PROGRAPE-4」を開発した。

 

表1 PROGRAPE-4の諸元

 

Name of the FPGA Board PROGRAPE(PROgrammable GRAPE) -4
Peak Performance 243.2 GFLOPS (collisionless gravitational N-body)
Programmable Logic Size 311,040 Logic Cells in total
Power Consumption 5 Watt (50 percent of logic cell at 100MHz)
Host Interface PCI-X(133MHz, 100MHz, 66MHz), PCI(64bit/66MHz, 32bit/33MHz)
Clock Frequency upto 133MHz (typically 100MHz)
Shape 200mm * 106mm, PCI-X card

 

写真1 PROGRAPE-4ボード(http://progrape.jp/)

写真2. PROGRAPE: 7.7 Tflops ヘテロジーニアス・リコンフィギャラブル・スーパーコンピューティングシステム (http://progrape.jp/)

 

 3.ヘテロジーニアス・リコンフィギャラブル・スーパーコンピューティングシステムの実現
  PROGRAPE-4とそれ以外のFPGAシステムを組み合わせることにより、異機種ハードウェアを搭載してテラフロップス級の高速計算を可能とした、 ヘテロジーニアス(異機種混合)リコンフィギャラブルスーパーコンピューティングシステムを構築した。(写真2)
 性能評価用のアプリケーションとして重力多体シミュレーションを使用、ハードウェアとしては以下のシステムを1ノードとし、合計9ノードセットを並列動作させた。

 

表2 計算ノードの構成

 

CPU Opteron 248/250 (2.2GHz/2.4GHz)
メモリ 1GB
マザーボード Arima社製 HDAMA
FPGAボード 2枚(PROGRAPE-4, Bioler-3の任意組み合わせ)
ネットワーク IOデータ社製 ETG2-PCI(gigabit)

 

  FPGAボードの構成はそれぞれPROGRAPE-4が18枚、Bioler-3が9枚の非対称なものとなっている。 このシステム上で、重力パイプラインを動作させた場合、PROGRAPE-4ボードの理論演算性能は243.2GFLOPSであり、 Bioler-3ボードでの理論演算性能は364.8GFLOPSである。 よって、システム全体を動作させたときの理論演算性能は18×0.2432 + 9×0.3648 = 7.661 TFLOPSとなり、 スーパーコンピュータに匹敵する理論演算性能をデスクトップサイズの計算機システムとして実現することができた。




12.プロジェクト評価


 本プロジェクトは、2004年度上期の未踏プロジェクトでの採択に引き続き、2度目の採択となった理化学研究所の濱田氏と中里氏によるプロジェクトである。
 採択の審査時点ですでに、FPGAを用いたリコンフィギャラブル・ハードウェアのためのFPGAシステム用コンパイラPGRを完成させており、デスクトップ上のFPGAボード単体で200GFLOPSを超える画期的な数値演算性能を実現していた。
 濱田氏らの提案するFPGAを用いたリコンフィギャラブルシステムは、専用ハードウェアやスーパーコンピュータでしか実現できなかった数値演算性能を卓上のPCとFPGAボードのみで実現することを可能にしており、天体物理における数値シミュレーションのみならず、他の大規模数値計算の分野にも革命をもたらすほどのインパクトを持つものである。

 今回、本格的にPGRシステムを普及し実用化していくために、より多くのFPGAボードにPGRを対応させ、さらに一般入手しやすい安価なリファレンス・プラットフォームとしてのFPGAボードを開発する必要があった。このようなボードを開発できれば、高速数値シミュレーション技術を今よりももっと身近なものにできる可能性がある。さらにまた、PGRコンパイラとFPGAボードの組み合わせによって構成されるリコンフィギャラブルシステムの可能性について考えたとき、これらは大規模数値計算シミュレーションへの応用だけでなく、高性能組み込みシステムを構築するための基盤技術としても位置づけることのできる非常に重要な技術であると思われた。
 濱田氏らのプロジェクトは、学会レベルで世界的にも最先端レベルの成果を出してはいたものの、勤務先の理化学研究所で主に担当している業務以外の仕事として行われている個人レベルのプロジェクトであったこと、まだ萌芽的な段階にとどまっており、競合する世界の他のグループが本格的に取り組めば、あっという間に現在の優位がくつがえりかねない可能性もあることから、未踏プロジェクトとして支援することは適当と判断し、採択を行った。

 今回、未踏プロジェクトとして採択し開発を推進することにより、低コスト版FPGAハードウェアの開発と量産・販売チャネルの確立にまで道筋をつけることができ、さらなる普及にむけて大きな一歩を踏み出すことができたと考える。

 実際のプロジェクトでは、濱田氏がハードウェアIPおよびFPGAボードの設計開発を、中里氏が数値計算シミュレーションのプログラミングを主に担当するという、作業分担となっている。
 濱田・中里両氏の成果についてみると、海外・国内の学会等での20件あまりの発表、海外の大学・研究機関との共同研究の推進、デスクトップシステムの単体FPGAボード上で200GFLOPS超の性能を実現したシステムの画期的なパフォーマンスなど、得られたプロジェクトの成果は一見派手とも見える華々しいものである。しかし、ここに至るまでには、アイデアを現実のものとする優れたプログラミング技術だけでなく、こつこつと数値演算用ハードウェアIPを整備するという地道な作業があったことを忘れることはできない。また、実際にモノとしての低コストFPGAボードを開発するにあたってはFPGAの入手から資金繰りに至るまで研究開発以外のことも全てこなすだけのバイタリティが必要不可欠であり、強い信念と困難に負けずにプロジェクトを推進するだけの情熱を持ち続けることなくしては、PROGRAPE-4ボードの一発完動はなかったであろうし、今回のプロジェクトは決して成し得なかったであろう。
 また、本開発がアプリケーション指向の開発プロジェクトであったことは、本プロジェクトが成功を遂げることのできた主な要因の一つであったと思われる。天体物理シミュレーションという明確なニーズがあったことで、極めて開発目標がクリアとなり、理論や概念レベルにとどまることなくアイデアを現実のものとして、実用的でコストパフォーマンスの極めて高いシステムを開発することができた。また、このような専門的なアプリケーションを開発する上で、天文学者としての開発者の果たした役割は特筆に値する。
 以上のことを鑑み、今回、濱田・中里の両氏を天才プログラマー/スーパークリエータとして認定すべきと判断した。



13.今後の課題


 低コストのPROGRAPE-4ボードの開発に成功し、一般向けの販売チャネルを構築できたことでPGRの本格的な普及が期待できるようになった。PGRとPROGRAPE-4を用いることで、高速数値シミュレーションがより身近なものになる可能性がでてきた。現在、まだ適用可能な数値シミュレーションなどのアプリケーション・プログラムについては限定されているが、利用が進んでユーザの層が厚くなるに従い、さらに応用分野は広がるものと期待している。そのためには、前年度の伊知地PMのコメントにもあるように、PGRがさらに誰にでも使いやすくなっている必要はあるかもしれない。
 また、PROGRAPE-4のように大容量の論理回路を搭載したFPGAボードが安価に販売されるようになれば、数値シミュレーション以外の応用、たとえば論理シミュレーション用のアクセラレータとしてのFPGAボードの利用も可能となってくる。PGRを数値計算以外の汎用的なものに拡張することで、数値計算用のパイプラインプロセッサだけでなく、現在はDSP等で処理しているような他のマルチメディア処理用アクセラレータなどもPGRの適用範囲とすることができるようになる可能性がある。
 また、現在、PGRの生成するハードウェア・アクセラレータは、標準的なSRAMインタフェースのみをサポートしているが、さらにイニシエータとしてDMAアクセス可能なIPをサポートできるようになれば、アクセラレータの性能も向上し、さらに応用範囲は広がってゆくことであろう。


  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004