平成14年度未踏ソフトウェア創造事業(未踏ユース)
採択案件評価
| 1.採択者氏名 | 西尾 泰和 21歳 (京都大学 工学部情報学科 3回生) 比戸 将平 21歳 (京都大学 工学部情報学科 3回生) | ||||||
| 2.プロジェクト実施管理組織 | 株式会社 創夢 | ||||||
| 3.委託金支払額 | 2,759,667円 | ||||||
| 4.テーマ名 | 4次元グラフによるゲノムの可視化 | ||||||
| 5.関連Webサイトへのリンク | |||||||
| 6.テーマ概要 このプロジェクトは,4次元的な情報を可視化することが出来るJavaアプレットを開発することが目的である. そのために,まず3次元のグラフを,直感的な操作で回転し任意の方向から見ることが出来る汎用的なアプレットを作成する.このアプレットによって,今までインターネット上では2次元的な画像に変換して掲載せざるを得なかった3次元的なデータを,3次元のまま掲載できるようになる.このような機能の需要は高い. そして,そのアプレットを4次元情報の可視化ができるように拡張する.4次元に拡張することで3次元上に分布するスカラー場,2次元平面上のベクトル場,複素関数などを描画することが可能になる.また,ゲノムの情報を4次元の曲線で表現する独自の可視化手法によって塩基含有率の偏りなどの情報をわかりやすく可視化することができるようになる. 余裕があれば高次元ではローカルミニマムに陥りにくい特徴を生かした,もつれにくい関連グラフ表示アプレットの開発に挑戦してみたい. | |||||||
| 7.採択理由 西尾君は大学1年生のときに,PMがひょんなことから発見し,未踏本ちゃんの和田健之介プロジェクトに紹介した学生である.いろいろな意味で普通の基準で測れない並み外れた人材だ.未踏ユースへの挑戦はゲノム構造の4次元的な可視化という彼らしいユニークなアイデアに基づく.これはゲノム研究者に新しい観測装置を与えることになるかもしれない.そんな夢のある提案である.しかし,出来上がるシステムはゲノム解析以外にも使途があると思う. | |||||||
| 8.成果概要 (1) 本プロジェクト用に特化した100%PureJavaの3Dレンダリングエンジン 既存のJava3Dなどのライブラリに頼らない,3D処理をすべて自前で行なうエンジンを開発した.本来3次元上の「線」でしかないデータを,どの視点から見ても太さがあるよう擬似的にポリゴンで表示することにより,ゲノム全体を見たときにもその形と色がはっきりとわかるようにできた.数十万ポリゴンにも及ぶヒトゲノムの可視化にも対応できる,高速なレンダリングエンジンとなった.西尾・図1は,この3Dエンジンを組み込んだアプレットが実際に動作している様子.1つ1つの菱形は3次元上の1つのポリゴンとして描画されたものである.
(2) 独自のゲノム可視化アルゴリズムを搭載したJavaアプレット ゲノムのシーケンスはA,T,G,Cの4種類の塩基で表される.それらの個数を4次元ベクトルに見立て,3次元上に等角写像を用いてマッピングするという独自の可視化アルゴリズムを開発した.これに基づいて配列の組成を大域的に把握することができるJavaアプレットを作成した.これにより,複数のシーケンスを同時に表示して構造を見比べることもできる.4次元ベクトルを対応させたポリゴンの色を,特定の色だけ強調させる機能もある. 西尾・図2は大腸菌の1種であるK-12,西尾・図3は同じく大腸菌のO-157のゲノムシーケンスの可視化結果である.両者は生物種としては近い関係にあるので,似た構造であることがわかる.O-157は食中毒事件で有名になった通り毒性を持っているが,それに対してK-12には毒性がない.つまり,この似たような2つの形の「差」の部分に,毒性を司る遺伝子が隠れている可能性が高いと考えられる.このアプレットを用いれば,このような情報をWebから誰でも参照できるようになる.
(3) アプレットと通信してデータを供給するサーバプログラム アプレットではセキュリティ上の制約から,任意のネットワークサーバにアクセスすることができない.そこでアプレットと同じサーバ上で動作するデータ仲介役とも言うべきサーバプログラムを作成した.実際にクライアントであるアプレットからデータのダウンロード要求が来た後は,メインスレッドとは別のスレッドを生成して処理をすべて任せるようにしている.Javaのマルチスレッドを用いたので,同時に複数の接続があっても耐えられる.また,このサーバ上で4次元等角写像に必要なデータの抽出・処理を行なって,描画に必要な情報だけをアプレットに送る.これにより,数メガバイトから数十メガバイトにも及ぶ配列データを閲覧のためだけにユーザのPCまでダウンロードしてくる必要がなくなる.将来的には,このサーバプログラムとアプレットの運用先を,外部に高速回線でアクセスできる環境や,ゲノムのシーケンスデータ自体をローカルネットワーク内に持っている研究所のサーバにすれば,アプレットを実行するユーザに,さらに快適な速度の可視化を提供できるようになる. (4) Pythonスクリプトで自由に拡張可能なプロ向け汎用可視化研究ツール 一般の人でもWebから気軽にアクセスできることを目指して作成した上記のアプレットに加え,専門家・研究者向けにさらに高機能で汎用性の高いツールを作成した.実装はDelphiを用い,3Dレンダリング部分にはOpenGLを採用した. | |||||||
| 9.PM評価とコメント このプロジェクトは天才学究肌の西尾君と,周囲も驚くプログラミング能力の開花を見せた比戸君との,喩えは悪いが,弥次喜多道中であった.比戸君は単に西尾君に誘われたというキッカケも面白い.2人ともごく短期間に一生のうちに学ぶべきことの最も重要な部分を学んでしまったというか,自己発見したに違いない. 最初は西尾君主導で始まったこのプロジェクトも,西尾君がDNAそのもの,あるいはその可視化理論,などなどへの学究的興味に走ったのに対し,比戸君は憶える言語・言語でたちまちのうちにあっという性能のプログラムをつくりまくるという展開になった.Java使いは,比戸君のプログラムの性能を見ると驚くに違いない.3次元レンダリングで大きなタンパク分子がころころ動くのを見ると (実は巧妙なトリックがあるのだが),100%PureJavaもうまく使うとあなどれないと実感できる. 未踏ユースでこういう連中を発見できるのはすごいことだと思うが,和田健之介さんのラボというとんでもない環境が彼らに与えられたことを忘れてはならない.いい意味での「気違い集団」に巻き込まれると,人は才能を自ら開花することができるといういい実証になった.思い起こすと,西尾君のDNAへの興味も和田さんの薫陶によるものだった. それはともかく,このプロジェクトの本題であるDNAの可視化は,すでに学会で高い評価を受けている.いわゆる薬屋さん (製薬会社の研究者) も彼らの成果を見るとびっくりして欲しがるのではなかろうか.それほどのインパクトがあるとPMは思うし,これを見た多くの人が口を揃えてそうだと言う. 成果のうち,3と4は,このシステムが専門家に使われるようになるためのきちんとしたソフトウェア作りになっている.特に4は可視化の方法を専門家にある程度任せるというものであり,まさに専門家が欲しがるものだと思う.ただし,そのためには,もっとメニューを増やしていくことが必要かもしれない.どんな可視化の方法があるか,それこそ予想もつかないからである. ここで開発されたソフトウェアは,複数の国立系研究機関から引き合いがある.今後の開発もその筋で円滑に進むことを期待したい.彼らの手を離れてもっと発展する可能性もあり得る. 西尾 ★★ スーパークリエータ: 称号をもらってもちっとも嬉しがらないのは目に見えるようだが,インパクトの大きい仕事をした.これからはソフトの世界ではないほうに行きそう.いい意味での奇人・変人. 比戸 ★★ スーパークリエータ: 西尾君の相棒だが,この短期間に見せた爆発的な成長と,でき上がったプログラムの性能や質の良さは特筆に値する. | |||||||
| (補足) | |||||||