iPS細胞を数学的に解析する
京都大学の石川雅人医生物学研究所特定助教、望月敦史教授、遊佐宏介教授、永樂元次教授、そして東京大学の木立尚孝准教授らの共同研究グループは、様々な遺伝子をノックアウトした後の時系列発現変化を計測したデータから、数理モデルに基づいて遺伝子制御ネットワークを高精度かつ半自動的に推定する手法RENGEを開発しました。
このRENGAという手法を使うと、シミュレーションデータとヒトiPS細胞における発現計測データの両方において、既存手法を凌駕する性能を示しました。
さらに、RENGEにより推定されたヒトiPS細胞の遺伝子制御ネットワークの解析から、iPS細胞の多能性を維持する上で重要なタンパク質複合体が示唆されました。
RENGEにより推定された遺伝子制御ネットワークを利用することで、細胞分化の鍵因子をネットワークから決定し、細胞運命制御を実現できる可能性があります。
この成果は、RENGE infers gene regulatory networks using time- series single-cell RNA-seq data with CRISPR perturbations(日本語タイトル:RENGE は CRISPR 摂動を伴う時系列 1 細胞 RNA-seq データを用いて遺伝子制御ネットワークを推定する)というタイトルで論文として発表されています。
研究の背景
生物の細胞内では、遺伝子から作られるタンパク質がお互いの発現を制御しあうことで、適切な遺伝子を発現させます。
これはタンパク質を介した遺伝子発現のダイナミクスとして1つの分野を形成しています。
遺伝子の制御関係は遺伝子制御ネットワークと呼ばれていますが、直接的な計測が難しく、研究では難易度が高いとされています。
解析する場合、遺伝子の発現量データなどから間接的に推定する方法が中心ですが、これに対して、遺伝子ノックアウトを利用する古典的な方法は、制御関係を比較的正確に捉えられると考えられます。
ある遺伝子をノックアウトし、その遺伝子由来のタンパク質機能を失わせた後に、他の遺伝子の発現がどのように変化したかを調べることで、ノックアウトした遺伝子がどの遺伝子を制御していたかが解析できます。
しかし、この方法で遺伝子制御ネットワークを推定する場合、多数の遺伝子をそれぞれノックアウトし、その後の発現変化を計測する必要がありました。
最新技術である、1 細胞 CRISPR 実験を用いることで、これを大規模に実現できると考えられましたが、ノックアウトした遺伝子から直接制御されている遺伝子と、他の遺伝子を介して間接的に制御されている遺伝子を区別することができないという欠点があります。
その理由は、遺伝子をノックアウトすると、その遺伝子が直接制御している遺伝子のみならず、さらにその下流にある遺伝子までもが発現変化するためです。
さらに、この方法ではノックアウトした遺伝子からの制御しか推定できないため、制御ネットワークに含まれるすべての遺伝子をノックアウトする必要がありました。
遺伝子制御ネットワークは「細胞の設計図」と言えます。しかし、遺伝子制御ネットワークは未だ部分的にしか明らかになっておらず、また正確にそれを決定することは困難な課題であり、実験手法的にも困難でした。
摂動に基づく遺伝子制御ネットワーク推定
摂動とは、系やプロセスに対する外部からの変化や影響を指します。物理学、数学、制御工学、生態学、生物学、および他の科学分野で使われる概念です。
具体的には、摂動は通常、ある系の基本的な状態や動作からの小さな変化や揺れを表します。これは系が元々持っていた状態や挙動を変え、系の安定性や振る舞いに影響を与えることがあります。
摂動の理解は、系の動態や応答を調査し、制御するために重要です。
摂動のステップは、以下のようになります。
- データ収集: まず遺伝子発現データを収集します。これは異なる条件や時間点での遺伝子の発現レベルを含むものです。
- モデルの定義: ネットワークをモデル化するために使用する数学的モデルを定義します。例えば、微分方程式や確率的なモデルが使用されます。
- 基本ネットワークの推定: 初期の状態での基本的な遺伝子ネットワークを推定します。これは、ネットワークが摂動を受ける前の状態を表します。
- 摂動の適用: 摂動を導入し、遺伝子発現データがどのように変化するかを観察します。これにより、ネットワークの変化や制御のメカニズムを理解する手がかりが得られます。
- ネットワークの修正: 摂動によって生じる変化を考慮して、初期のネットワークモデルを修正します。これにより、遺伝子間の新しい相互作用や制御関係を統合できます。
- モデルの評価: 推定された遺伝子制御ネットワークが実際のデータとどれだけよく一致するかを評価します。モデルの信頼性を確認します。
これらのステップは一般的な手順であり、具体的な手法やアルゴリズムは研究者によって異なります。摂動に基づく遺伝子制御ネットワーク推定は、システム生物学や計算生物学の分野で活発な研究が行われており、新しい洞察を提供するための有望な手法と考えられています。
今回の研究はどういうものか?
研究グループは、遺伝子をノックアウトした後に時系列で発現量を計測し、その発現ダイナミクスから情報を抽出することで、これまでの問題を解決できることに気づきました。
そして、そのようなデータから遺伝子制御ネットワークを推定する手法である RENGE を開発しました。
RENGE は遺伝子ノックアウトの影響を、数理モデルを使って他の遺伝子へ伝わっていく過程を捉えます。
数理モデルの中には制御ネットワークを表すパラメータが含まれており、遺伝子ノックアウト後の発現ダイナミクスを説明できるようにパラメータを推定することで、制御ネットワークが推定されることになります。
研究グループは、仮想的なデータを設定し、RENGE の推定精度を検証し、既存手法より際立って優れた性能を証明しました。
このRENGAを実際の応用研究に使い、ヒト iPS 細胞を用いて 1 細胞 CRISPR 実験を行いました。
CRISPRによる遺伝子ノックアウト後の時系列発現データを取得し、RENGAによって解析することで、ヒトの多能性維持に関わる 103 遺伝子を含む遺伝子制御ネットワークを同定することができました。
例えば、iPS細胞の研究に関与する多能性因子として知られる POU5F1(OCT4)、SOX2、NANOG などにより形成される正のフィードバックループ、それらの多能性因子による分化関連遺伝子の直接的抑制などの特徴が見られました。
これらの研究は、分子生物学における数十年の研究によって蓄積されてきた知見から成立しているものですが、わずか1回の実験と RENGE の推定により得ることができるという画期的な研究方法が確立されたことが証明されました。
さらに、この制御ネットワークにおいて同じターゲット遺伝子を制御している転写因子は、タンパク質複合体として働く傾向があることがわかりました。
転写因子がタンパク質複合体を構成して作用することは様々な現象で明らかになっていますが、今回の解析においてもPRDM14 と RUNX1T1 が複合体を形成して iPS 細胞の多能性維持に働く可能性が示唆され、これまでの知見と矛盾しない結果を得ることができました。
波及効果
近年、様々な研究が数学的な解析、数理モデルを使って解析する手法を確立するようになりました。
本研究で開発した RENGE は、遺伝子の摂動により得られる数学的な情報を最大限に活用してネットワークを推定する手法です。こ
の手法は iPS 細胞以外の細胞種など他の生命システムにも適用可能であるため、RENGE によって様々な生命現象を支配する制御ネットワークを正確に推定できる可能性があります。
つまり、iPS細胞からの分化過程を実験のデータと数理学的なモデルを使ってカギとなる遺伝子を特定し、特定の機能を持つ細胞を人工的に作り出すなど、新しい方法の開発が可能となるかもしれません。
再生医療の研究を加速させる研究結果として注目される今回の研究ですが、RENGAは今後の研究によってさらに改良され、もっと大規模なデータを解析できるようになることも今後期待されます。