AIが数千万の「ミスセンス変異」を予測することに成功、人類遺伝学の課題解決に期待

AIが数千万の「ミスセンス変異」を予測することに成功、人類遺伝学の課題解決に期待

人工知能(AI)は、人類の遺伝学における最大の課題の1つを解決すると期待されています。

ちょうど今、 Google DeepMindの研究チームがAlphaFold方法論に基づいてAlphaMissenseを作成しました。これは、タンパク質配列データベースと変異構造の背景を利用して、病原性のミスセンス変異と未知の病原性遺伝子を特定することができます。

AlphaMissense は、多くの既存の類似ツール (変異効果予測子または VEP) と比較して優れた機能を発揮することが報告されています。

具体的には、AlphaMissense は 19,233 個の標準的なヒトタンパク質における 2 億 1,600 万個の可能性のある単一アミノ酸の変化の病原性を予測することに成功し、7,100 万個のミスセンス変異を予測しました。その後、 AlphaMissense はミスセンス変異の 89% を正確に予測し、そのうち 57% は良性であり、32% は病原性である可能性があることが判明しました

「AlphaMissense によるプロテオーム全体のミスセンス変異の影響の正確な予測」と題された関連研究論文が、権威ある科学雑誌 Science に掲載されました。

同時掲載の意見記事で、エディンバラ大学の計算タンパク質生物学教授ジョセフ・A・マーシュ氏と、ウェルカム・サンガー研究所の細胞遺伝学部門長でケンブリッジ大学の研究員サラ・A・タイヒマン氏は次のようにコメントしている。

「この研究は間違いなく変異の解釈と優先順位付けに役立つが、複数の証拠に基づくこれらの用語の特定の臨床定義とこれらのラベルを混同しないことが重要だ」

Google DeepMind が AlphaMissense のすべての予測を研究コミュニティに無料で公開し、AlphaMissense モデルのコードをオープンソース化していることは注目に値します。

ミスセンス変異の89%を予測することに成功

ミスセンス変異とは、タンパク質のアミノ酸配列を変化させる可能性のある遺伝的変異です。病原性のミスセンス変異はタンパク質の機能を著しく損なわせ、生物の適応度を低下させる可能性がありますが、良性のミスセンス変異は影響が限定的です。

観察された 400 万を超えるミスセンス変異のうち、臨床的に病原性または良性として分類されているのは約 2% のみであり、残りの未知の変異を分類することは、人類遺伝学における大きな課題です。ミスセンス変異の正確な機能予測が欠如しているため、希少疾患の診断率や、根本的な遺伝的原因を標的とした臨床治療の開発と応用が制限されています。

変異体効果の多重解析 (MAVE) はタンパク質変異体の影響を体系的に測定し、変異体の臨床結果を正確に予測することができますが、MAVE 実験はコストがかかり、労働集約的であるため、変異体の病原性に関するプロテオーム全体の調査は不完全なままです。

機械学習手法は、生物学的データ内のパターンを活用して注釈のない変異の病原性を予測することにより、この変異の解釈のギャップを埋めることができます。 AlphaFold の成功により、タンパク質配列を入力として使用して大規模で高精度なタンパク質構造を予測できることが実証され、このようなタンパク質構造モデルは、変異体の病原性など、タンパク質生物学の他の側面を理解するための基礎として役立ちます。

この研究では、 AlphaMissense は AlphaFold の方法論を活用して、既存の戦略の 3 つの要素を組み合わせました

1) 人口頻度データに基づく弱くラベル付けされたトレーニングにより、手動の注釈の使用が回避され、循環性が回避されます。

2) 教師なしタンパク質言語モデリングタスクを使用して、配列コンテキストに条件付けられたアミノ酸分布を学習する。

3) AlphaFold から派生したシステムを使用してコンテキストを統合します。

論文によれば、 AlphaMissense のトレーニングは、構造事前トレーニングとバリエーション微調整の 2 つの段階に分かれています。事前トレーニング フェーズは AlphaFold で説明されているものと同じですが、マスクされた複数のシーケンス アライメント再構築損失に、より高い重みが追加されます。微調整中に、モデルは変異体の病原性と参照配列の構造を同時に予測するように最適化されます。

これまでの研究では、良性のトレーニングバリアントは、PrimateAI メソッドに従って定義される、人間や他の霊長類種で頻繁に観察されるバリアントに基づいているのに対し、病原性のトレーニングバリアントは、トリヌクレオチドのコンテキストと遺伝子に応じてサンプリングの重み付けが行われ、人間の集団で観察されたことのないバリアントからサンプリングされていることが示されています。

AlphaMissense は、突然変異がタンパク質構造に与える影響や、タンパク質の安定性に及ぼすその他の影響を予測するものではありません。代わりに、関連するタンパク質配列のデータベースと変異体の構造的コンテキストを使用して、変異体が病原性である可能性が高いかどうかを評価する 0 から 1 の間のスコアを生成します。連続スコアにより、ユーザーは、変異体を病原性か良性かに分類するための精度要件を満たすしきい値を選択できます。

AlphaMissense は、7,100 万の可能性のあるミスセンス変異のうち 89% を、病原性の可能性が高い、または良性の可能性が高いと分類しました。対照的に、変異体のわずか0.1%が人間の専門家によって確認されています。

AlphaMissense は、そのようなデータで明示的にトレーニングすることなく、幅広い遺伝的および実験的ベンチマークで最先端の予測を実現します。

このモデルは、人間の変異と疾患の関係に関する公開データアーカイブであるClinVarの変異の分類に使用された際にも、他の計算方法よりも優れた性能を示した。

人類の遺伝学の謎を解く潜在的解決策

AlphaMissense の予測は、間違いなく、変異がタンパク質機能に及ぼす分子的影響を明らかにし、病原性のミスセンス変異や未知の病原性遺伝子を特定し、希少遺伝性疾患の診断率を向上させるのに役立ちます。さらに、AlphaMissense は、特殊なタンパク質変異体効果予測子のさらなる開発を促進します。

マーシュ氏とタイヒマン氏は、AlphaMissense の限界についても指摘した

現在、その予測子の構造要素は、ほとんどのタンパク質が多様な四量体構造を持つ複合体または凝縮体に組み立てられることを考慮していません。複合体を形成するタンパク質の変異は、単量体構造のみを考慮すると明らかではない方法で疾患を引き起こす可能性があります。

さらに、多くの疾患関連変異はタンパク質の不安定性や複合体の組み立ての破壊を通じて機能喪失を引き起こしますが、他の場合には、変異タンパク質が優性負性効果や相乗効果を通じて疾患を引き起こします。

したがって、通常はアミノ酸に対する小さな変動であり、これまでにテストされたほぼすべての変異効果予測子 (VEP) では正確に予測することが困難な、機能喪失型ではない変異体に対して AlphaMissense がどのように機能するかを観察することは興味深いことです。

最終的には、タンパク質複合体の構造を予測するアルゴリズムを通じて、タンパク質四量体構造に関する情報を組み込むことが可能になり、変異効果予測の分野でのさらなる改善につながることが期待されます。

参考リンク:

www.science.org/doi/10.1126/science.adg7492

www.science.org/doi/10.1126/science.adj8672

著者: ヤン・イーミ

編集者: 学術

<<:  秋分の日にこれらの症状が出たのに気づかない人は、シェーグレン症候群の可能性があるのでご注意ください!

>>:  水中に「四つ足の生き物」はいますか?奇妙な見た目の張氏のユニコーンシュリンプ

推薦する

デュアルカメラは役に立たないのでしょうか?回答者の70%は、携帯電話にデュアルカメラがあるかどうかは気にしないと答えた。

ほとんどの消費者にとって、カメラ機能が強力であるかどうかは、携帯電話を選択する際の重要な参照基準とな...

きのこ豆腐の作り方は?

豆腐は栄養が豊富で、体にとてもいいです。おいしいキノコと組み合わせると、栄養もおいしくなります。そこ...

粉砂糖の代わりに何が使えますか?

砂糖は、私たちの毎日の食生活の中で誰もが接触する食品です。家庭で使われる砂糖は主に調味料として使われ...

痩せている人も脂肪肝になる可能性があり、これはあなたが思っているよりも危険です丨全国肝臓ケアデー

社会経済の発展とライフスタイルの変化に伴い、わが国では脂肪肝の発症率がますます高くなり、若年化してい...

睡眠時間が短いと太りますか?睡眠は進化できるのか?睡眠に関する、あまり知られていない10の事実をご紹介します。

世界保健機関(WHO)の統計によると、世界の睡眠障害率は27%に上り、中国では成人の不眠症発症率は3...

2018年型メルセデス・ベンツEクラスは技術面で大幅にアップグレードされ、価格は422,800~629,800人民元となっている。

メルセデス・ベンツの公式サイトによると、2018年型メルセデス・ベンツEクラスが合計8モデルで正式に...

ニクジュヨウの食べ方

伝統的な中国医学は、常に我が国の特徴です。我が国には知られていない貴重な中国薬材がたくさんあります。...

ほうれん草の調理方法

ほうれん草を食べるときは、そのまま炒めることが多いと思います。ほうれん草をソテーするという調理法は面...

謝柏の効能・効果と食べ方

一般的な薬の種類はたくさんあります。薬を選ぶときは、病気に応じて選択する必要があります。これは、自分...

ニンニクの芽を食べることの利点

ニンニクの芽は非常に一般的です。この種の野菜を調理する方法はたくさんあります。最も一般的な方法は、ニ...

牛ブリスケットスープのレシピ

牛にはブリスケットと呼ばれる部位があります。ブリスケットは料理に非常に適した材料です。ブリスケットを...

現代の「Kuafu」衛星はどのようにして太陽を追跡するのでしょうか?

制作:中国科学普及協会著者: 王正プロデューサー: 中国科学博覧会2022年10月9日午前7時43分...

大根は消化を助けるのでしょうか?

ご存知のとおり、大根は私たちの日常生活で最も一般的な野菜の一つです。私の国では大根の栽培は何千年もの...

男性のヒント: 食べ物の「ゴールデンパートナー」

食卓に適切な食べ物を組み合わせることで、より多くの栄養を得ることができます。間違った組み合わせは、食...

世界予防接種週間丨なぜ予防接種を受ける必要があるのでしょうか?

なぜワクチン接種を受ける必要があるのでしょうか?ワクチン接種は感染症を予防し、制御する最も効果的な手...