デジタル人材の育成
ヒトを含めたあらゆる生物では、 遺伝情報をゲノム、すなわち塩基配列の形で保持している。ゲノムには生物を形作るために必要な情報のほとんど全てが含まれていると考えられており、生物学・医学・薬学・農学など生物を扱うあらゆる学問分野においてゲノム研究は極めて重要である。同じ生物種でも個体ごとで塩基配列に違いがあるため、参照配列と呼ばれる種を代表する塩基配列が定められている。多くのゲノム研究では、遺伝子の座標区間やさまざまな個体の参照配列からの差分(多型情報)など、多様なゲノム由来の情報を参照配列に対応付けた上で様々な解析を行っている。「ゲノムブラウザ」はそうしたゲノムに関わる情報を統合し、インタラクティブに可視化するソフトウェアであり、情報の解釈を容易にし、新たな知見を得るために、主に研究者の間で広く用いられている。
DNAの読み取り技術はこの12年間で約100億倍の進歩を遂げ、日常的に解析対象となるゲノム配列の数も少なくとも1万倍以上になった。これに伴い、個体間のゲノム配列の違いがより明らかになり、ただ1本の参照配列の上にあらゆる情報を対応付けることが難しいケースも多く存在することが分かってきた。例えば、大規模な構造変異により遺伝子が重複・欠損・融合し、それが遺伝性疾患やがんの原因となっている場合である。このため、ゲノムを1本の線ではなく、グラフ構造を用いて分岐やループなど様々なパターンを表現可能にする「グラフゲノム」を用いた解析が近年有望視されている。しかし、現在普及しているゲノムブラウザではグラフゲノムを可視化することは想定されていない。
本プロジェクトでは、今後のゲノム解析で重要となるグラフゲノムの可視化をするためのグラフゲノムブラウザを開発する。本ゲノムブラウザにより、ゲノム上のグラフ構造をブラウザ上で俯瞰的に捉え、探索的な解析を可能にすることで研究の促進が期待できる。
ゲノムブラウザは、ヒトの遺伝情報であるDNA配列を画面上に可視化するソフトウェアである。主に生物学の分野で、遺伝子疾患、進化、生物の種といった研究に用いられる。DNA配列を、一直線の配列ではなく、グラフとして可視化、取り扱いできるゲノムブラウザを開発し、新たな研究手段を提供しようという提案である。
大勢が使う種類のソフトウェアではない。しかし、このソフトウェアが可能にする研究は科学や医療に大きく貢献する可能性がある。研究者が標準的に使うというくらいのものを作って欲しい。