九州大学 生体防御医学研究室 構造生物学分野 TRUE COMBINATION OF XRAY,NWR AND EM FOR STURUCTURAL BIOLOGY

構造生物学について

Structural Biology

構造生物学とは

構造生物学とは生体高分子,特にタンパク質の立体構造に基づいて,その分子機能を説明する学問分野です.例えば,酵母のPCNAタンパク質は三量体のリング構造をとっています.このリング中央の穴の大きさは2本鎖DNAがちょうどはまる大きさです.PCNAはDNAが複製されるときにDNAポリメラーゼがDNAからはずれないようにする働きをしていることが,立体構造から直感的に理解できます.

タンパク質分子をあたかもマクロな機械として扱い,その動作する様子を記述することが可能です.これはかなり思い切った簡略化ですが,酵素反応などを除くと,タンパク質の機能の多くをうまく説明できます.これが現代生物学研究において,構造生物学アプローチが広く使われる理由です.

 

しかし,現実のタンパク質分子は周囲の水分子と衝突しながら,自身も熱的に振動して揺らぎながら機能しています.次世代の構造生物学研究は動的な観点や量子生物学的な観点を取り入れて,構造から機能を説明する必要があるでしょう.

構造生物学のセントラルドグマ

なぜ構造生物学アプローチが必要なのでしょうか?
1.タンパク質のアミノ酸配列が決まれば立体構造は一つに決まる
2.最終立体構造は自由エネルギーが最小である
3.したがって、原理的には計算で立体構造予測ができるはず
4.しかし,計算の複雑性などから現時点では実現は困難である
5.そこで,実験的に立体構造を決定する必要がある

タンパク質のドメイン構造

タンパク質ドメインは50~200残基のアミノ酸配列からなり,タンパク質の構造・機能・進化の単位です.1つのタンパク質は複数のタンパク質ドメインをブロックとして組み立てられた構造体として理解できます.すなわち,ドメインの構造と機能のデータベースを用いて,タンパク質の生体機能を個々のドメインの生化学的な機能の組み合わせとして推定することができます.構造生物学研究ではタンパク質全体を用いる代わりに,それぞれのドメインを切り出して,その立体構造決定を行うことが普通に行われます.

タンパク質のフォールド

タンパク質を構成する2次構造の種類と位置関係,およびそれらの連結の仕方をフォールドと呼びます.この時,側鎖の違いや多少の長さの不一致を無視して,主鎖のおおまかな流れを指します.統計学的な推定に基づいて,自然界に存在するタンパク質ドメインのフォールドの種類を推定すると,その総数は千から多くても数千種であるとされています.現在,既に約1,000個のフォールドが知られています.

構造ゲノミクスと構造生物学の相違

構造ゲノミクスとはタンパク質の立体構造の網羅的な決定を目指す大型プロジェクトです.フォールドの百科事典を完結する,あるいは1つの生物種がもつすべてのタンパク質の立体構造を決定することを目指しています.構造ゲノミクスでは多数のタンパク質候補から出発し,構造解析に適したものを選別して行くことで,立体構造決定を網羅的かつ機械的に行います.最後に立体構造解析が可能として残る割合は出発時の一割程度であるとされています.これに対し,構造生物学研究者は興味のあるターゲットをあらかじめ少数に絞り込んでいます.迅速に構造決定できる確率は一割程度にすぎませんが,条件の最適化をなどの努力をすることで,成功の確率を上げ,研究対象のタンパク質の立体構造決定を目指します.

タンパク質の立体構造解析の手順

1. 対象となるタンパク質の選択
2. 大量発現系の構築(大腸菌など)
3. 大量調製
4. 予備的なデータ測定,最適な測定条件を探索する
5. 構造決定のためのデータ収集
6. 立体構造計算
7. 立体構造の評価と解析
立体構造情報はProtein Data Bankと呼ばれる公共データベースに登録され,すべての人が無償で利用することができます.

立体構造解析方法の特徴と比較

X線結晶解析は立体構造決定専用の手法です.方法論が確立している,自動化が容易などの点から構造生物学や構造ゲノミクスの中心的な方法です.

NMR法は分子量の制限(5万以下)などがあり,汎用性においてはX線結晶解析の方が優れています.しかし,NMR法は構造決定以外に有用な情報を与える測定法です.例えば、アミノ酸置換体が同一のフォールドをもっているかを迅速に判定,低分子や他の生体高分子との相互作用の解析,緩和時間解析で動的な情報を得ることができることがあげられます.

電子顕微鏡は直接タンパク質分子を見ることができますが,電子線照射による損傷を避けるために電子線量が制限されるため,得られる像はそのままでは原子分解能の情報を与えません.タンパク質の2次元結晶の電子線回折を行う方法はX線結晶解析と同じ原理に基づいています.膜タンパク質に有効であると期待されていますが,2次元結晶を得ることが難しいという問題があります.一方,単粒子解析は多数の像を集めて平均化することでタンパク質粒子の構造を得る方法です.2015年以降の検出器の技術革新により,単粒子解析の分解能がX線結晶解析の分解能と肩を並べるまでになりました.単粒子解析は結晶を必要とせず,迅速な方法であり,立体構造手法としてファーストチョイスになりつつあります.

あなたのタンパク質は本当に立体構造を形成している?

大腸菌などを用いてタンパク質を発現したときに,あなたのタンパク質は本当に天然状態の立体構造を形成しているのでしょうか? 透明なタンパク質溶液が得られたからと言って安心は禁物です.立体構造形成がきちんと起こっていることを証明することはそれほど簡単なことではありません.たとえ酵素活性や結合活性が検出できても不十分です.NMRを用いるとこの問題に明確に答えることができます.立体構造形成に失敗したタンパク質は一部に集まったスペクトルを与えるのに対し,立体構造形成がうまくいき,しかもアグリゲーション(非特異的な会合)がない場合は,きれいに分散したスペクトルを与えます.このような定性的な結果でよければ,分子量の制限も緩く,必要なタンパク質量も少なくてすみます.

AI予測を使えばあれば立体構造を決定をしなくてもよい?

AlphaFold2をはじめとするAI(深層学習)を使って,アミノ酸配列情報から立体構造を高い精度で決定できるようになっている.さらにアミノ酸配列を複数入力することで,相互作用予測も可能になった.同じアミノ酸配列ならサブユニット構造の予測となり,異なるアミノ酸配列ならどの部分で互いに結合するかを予測することになる.このような状況なら,もはや立体構造決定は不要では? と多くの人は考えるのは無理もない.多くの人(生命科学関係の研究者を含む)にとってはAI予測で十分だろう.きれいな絵を描いたり,アミノ酸変異を入れる場所を特定するだけなら現時点のAI予測で十分である.これに対して,酵素活性発現のメカニズム,創薬を目指した化合物との結合様式など,側鎖を含む原子レベルの精度が要求される場合は,実際に立体構造決定が必要である.蛋白質分子は進化の過程でわざと不安定で柔軟性が高くなるように最適化されていて,環境の変化に応じて立体構造を変化させる能力を備えている*.今の所,AI予測は立体構造変化をきちんと予測できるレベルには達していない.将来的に可能になるかどうかは現時点ではわからない.深層学習にはデータが必要である.立体構造データベース(Protein Data Base)に登録されている20万件のデータでは足りないかもしれない.このレベルになると,計算シミュレーション(分子動力学計算)が役に立つようになる.
*この点が昨今可能になってきた人工蛋白質の設計と異なる点である.人工蛋白質はやたら丈夫で100℃近くになっても変性しないことが多い.

このページの先頭へ