| 分子の化学構造を表記する方法に、SMILES記法(Simplified Molecular Input Line Entry Specification syntax)という方法がある。SMILES記法とは、グラフ理論に基づいて考案された表記方法で、化合物中の原子をノード、原子間の結合をエッジと見立て、化学構造を1行の文字列で表す方法である。SMILESは文字列であるために、化合物のデータベースを作成するのに大変扱いやすく、広く用いられている。しかしながら、SMILESから得られる情報は、化合物の原子種とそれらの結合情報だけで、原子の座標情報を得ることが出来ない。そこで、本プロジェクトではSMILESから化合物の3次元立体構造を構築するプログラムの作成を第1の目的とする。さらに、構築した化合物の3次元立体構造を用いて、薬物標的タンパク質との結合様式や結合親和性を評価するプログラムの作成を第2の目的とする。
具体的な開発項目は以下の通りである。
1.SMILESからの原子の種類と結合情報の抽出
グラフ理論を利用して、SMILES文字列から化合物を構成する原子の情報と、それらの原子の結合情報を抽出する。これによって、化合物の2次元構造の構築を行うことが可能となる。
2.原子の種類と結合情報からの3次元構造構築
抽出された原子の種類と結合情報に加え、化合物の結合長や結合角度などの経験的なパラメータ(分子力場)を用いて、3次元構造を構築する。
3.3次元構造の最適化計算
3次元構造の最適化には、分子力学法を用いる。分子力学法に用いるエネルギーの計算式は単純であるため、コーディングも容易で、計算量も少なくて済む。
4.薬物標的タンパク質との親和性評価
薬物標的タンパク質のリガンド結合部位に、本プロジェクトで作成する化合物の3次元立体構造を当てはめ、タンパク質-薬物間の結合様式の最適化、結合の親和性を分子力学法により計算する。
5.Web上へのJavaアプレットの公開
本プロジェクトにより作成したプログラムを公開するWebサーバを構築し、広く一般に公開する。
|