多種の条件下におけるトランスクリプトームデータを用いた生命システムの統計解析
開催期間
16:00 ~ 17:00
場所
講演者
概要
DNAの遺伝子情報を基に転写されるmRNAは様々な状況下においてその発現パターンが
変化する。mRNAを観測する事で、従来のゲノム解析では推定が困難なストレスや特殊
環境下における発現変化を捉えることができる。また、タンパク質へ翻訳されないノ
ンコーディングRNAの存在は、プロテオーム解析のみでは得られない新たな生命機構
の解明を必要とさせた。そのため細胞内のmRNAの総体:トランスクリプトームの解析
が重要視されている。
近年、次世代シークエンサーを用いてmRNAを観測することで一度に大量のmRNA情報
を取得することが可能となった。しかし通常シークエンサーは短く断片化されたRNA
分子を読むため、なんらかの方法を用いて元のトランスクリプトを復元しなければな
らない。しかしPCR等の増幅率は配列によって異なる上、検出の過程で発生するノイ
ズ等のため、ゲノムにマップされた次世代シークエンスデータをそのままトランスク
リプトの発現値として用いることは困難である。その問題に対し、我々は多種の条件
下の実験で得られたトランスクリプトームデータのゲノム位置間における相関;
Positional correlation を用いた解析法を開発した。Positional correlation は増
幅率やノイズの影響を軽減し、トランスクリプトの全体像を明確にすることができ
る。本セミナーでは、まずトランスクリプトームデータ解析における生物学的背景に
ついて説明する。次にPositional correlationと統計手法を用いた遺伝子モデル予測
やalternative start/end/splicing sitesの検出および得られた予測遺伝子モデルの
データベースを介した機能予測について説明する。最後に実際の次世代シークエンス
データへの適用結果について紹介する。