大躍進! AIはタンパク質設計における大きなギャップを埋めるのか、あるいはがんや認知症の謎を解くのか?

大躍進! AIはタンパク質設計における大きなギャップを埋めるのか、あるいはがんや認知症の謎を解くのか?

序文

脳卒中や認知症などの神経疾患は、病気や障害の主な原因の一つです。世界保健機関(WHO)によれば、世界人口の3分の1以上がこのような病気に苦しんでいる。その中でも、神経変性疾患は、人間の健康と生活の質に深刻な脅威をもたらす慢性かつ一般的な疾患の一種です。

タンパク質の構造と機能に対するより深い理解は、これらの疾患に対処するための重要な洞察をもたらすでしょう。タンパク質の折り畳みの研究は 1950 年代に始まりました。 AlphaFold の出現により、科学者がタンパク質の折り畳みを研究するパラダイムが完全に変わりました。

今日、タンパク質科学におけるAIは新たなブレークスルーを達成しました——

最近、コペンハーゲン大学、セントジュード小児研究病院、イリノイ工科大学の研究チームが、特定の構造特性を持つタンパク質変異体を設計するための一般的なアルゴリズムを導入し、タンパク質の研究を天然変性タンパク質(IDP)の分野にまで拡大しました。

IDP は、安定した、または秩序だった三次元構造に折り畳むことができないタンパク質であり、健康なシステムとさまざまな疾患の病態生理学の両方において重要な生物学的意義を持つと考えられています。折り畳まれたタンパク質とは異なり、IDP は高い無秩序性、局所的な可動性、および高いダイナミクスを特徴としており、既存の予測ツールにとって特に困難です。

この研究では、理論的に新しい設計方法を提案しただけでなく、設計されたIDPバリアントを実験を通じて検証し、機械学習モデルを使用してIDPの集合的特性を予測し、計算によるタンパク質設計のための新しいツールを提供しました。これは、さまざまな神経変性疾患(アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症など)やさまざまな種類の癌の発症機序の理解に役立つだけでなく、新薬の発見や生体材料の開発を促進することにも役立つ可能性があります。

「多様な構造特性を持つ本質的に無秩序なタンパク質変異体の設計」と題された関連研究論文が、権威ある学術誌「Science Advances」に掲載されました。

なぜ国内避難民のことを気にかけるべきなのでしょうか?

折り紙は、特定の方法で折られるまでは圧縮された木材パルプに過ぎません。一度折ると、それは何か新しいものになります。数回正確に折ったりひっくり返したりすると、あなたの未来を予測できる紙製品、つまり幸運の棒になります。同じ紙でも、折り方を少し変えるだけで、翼を広げて飛び立とうとする鶴になり、幸運の到来を象徴します。

同様に、アミノ酸分子の長い鎖は、特定の形状に自発的に折り畳まれるまで機能しません。細胞は、アミノ酸の小さな分子を長いポリペプチド鎖につなげてタンパク質を作ります。どのアミノ酸が選択されるかは、DNA によって提供される一連の指示によって決まります。ポリペプチド鎖は生成された直後に正確に曲がり、折り畳まれて、タンパク質の最終的な 3D 形状になります。

タンパク質がこの折り畳みプロセスを極めて効率的に完了できない場合、人体には一連の災害が発生します。誤って折り畳まれたり、折り畳まれなかったりしたタンパク質は毒性を帯び、細胞死を引き起こす可能性があります。鎌状赤血球貧血などの多くの病気や障害は、誤って折り畳まれたタンパク質によって引き起こされます。誤って折り畳まれたタンパク質は凝集して塊になることもあり、これはアルツハイマー病やパーキンソン病などの神経変性疾患の特徴です。

したがって、タンパク質分子の 3D 形状を予測することは、神経変性疾患の理解や治療にとって非常に重要です。

しかし、構造生物学の分野は歴史的に、安定した 3D 構造に折り畳まれるタンパク質と核酸の研究に重点を置いており、細胞内でのタンパク質の機能に関する現在の理解の多くは、「配列-構造-機能」の関係という概念に基づいています。

真核生物のタンパク質の約 30% は安定した 3D 構造に折り畳まれません。これらの動的に変形するタンパク質は IDP と呼ばれ、他の構造化タンパク質ドメインのコンテキスト内に位置する場合は「本質的に無秩序な領域」(IDR) と呼ばれます。 IDP と IDR は分子および細胞機能においてさまざまな重要な役割を果たし、配列-構造-機能のパラダイムに挑戦します。

IDP の調節不全の細胞機能は、いくつかの神経変性疾患 (アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症) や多くの癌に関係していると考えられており、自己会合して生体分子凝縮物を形成し、細胞環境でさまざまな膜のない細胞小器官を生成する IDP の能力は、細胞生物学と疾患において非常に重要であることがますます認識されています。

生物学と人間の病気をより深く理解するために、ダートマス大学の助教授ポール・ロブステリ氏は、関連記事で次のように強調しています。「構造生物学は、安定した 3D 構造を持つタンパク質の研究にとどまらず、IDR の配列が溶液中でのタンパク質の形状分布をどのように決定し、この分布が細胞内でのタンパク質の機能と病気における機能不全をどのように決定するかを説明するルールを開発する必要があります。」

計算によるタンパク質設計をIDPに拡張する

IDP は極端ではあるものの、一般的にはランダムではない構造的異質性を持ち、安定した折り畳み構造を形成できないため、IDP の構造予測は折り畳みタンパク質の構造予測よりも困難であり、その計算設計は依然として限られています。

Francesco Pesce 氏とその同僚たちはこの課題に取り組んできました。研究チームは、以前に公開された CALVADOS と呼ばれる計算モデルを基に、事前定義されたグローバル プロパティを持つ IDP を生成するための一般的なアルゴリズムを設計し、それを使用して異なる特性を持つ 4 つの IDP を生成しました。彼らはまた、A1-LCDと呼ばれるIDPの一種に焦点を当て、A1-LCDのいくつかの変異体について、モデルによる配列アンサンブル関係の導出を実験的に検証しました。

彼らは、特定の構造特性を持つタンパク質変異体のための一般的なアルゴリズムを設計しました。このアルゴリズムは、粗粒度シミュレーションと自由エネルギー計算をモンテカルロサンプリング法と組み合わせて使用​​し、配列空間を検索して、対象となる構造的特徴を持つタンパク質配列を生成します。研究者らはこのアルゴリズムを使用してさまざまなタンパク質変異体を設計し、実験的に検証した。結果は、アルゴリズムが、異なるコンパクトさ、長距離相互作用、相分離傾向を持つタンパク質変異体を効果的に設計できることを示しました。

このアルゴリズムは、効率的な粗粒度シミュレーションを使用して、配列空間を検索し、各配列をその立体配座特性に関連付けます。 CALVADOS モデルを使用して粗視化分子動力学 (MD) シミュレーションを実行し、IDP の立体配座集合を生成しました。このアルゴリズムは、モンテカルロ法 (MCMC) を使用して配列空間をサンプリングし、その立体配座特性を予測します (MD シミュレーションと自由エネルギー計算経由)。最適化プロセスを通じて、特定のアミノ酸の配置が求められ、対象となる構造的特徴が特定されます。

図 |標的の立体構造特性を持つ IDP 配列を設計するための研究チームのアルゴリズムの概要。

このアルゴリズムは、コンパクト性、長距離接触、相分離傾向などの特定の構造特性を持つ IDP シーケンスを設計できます。さらに、配列空間を探索し、新しい立体構造特性を持つ IDP 配列を見つけることもできます。研究チームはまた、アルゴリズムを高速化し、効率化するために機械学習モデルも使用しました。

今後、研究チームは、より広範囲のシーケンス空間をサンプリングし、MCMC サンプリングと他の方法 (強化学習やベイズ最適化など) を組み合わせて、シーケンス空間をより効果的に探索することを検討することを推奨しています。さらに、著者らは、より複雑な構造観測値を持つ配列を設計する場合、シミュレーションはより高価になり、化学計算は効率が低下する可能性があるため、機械学習とシミュレーションの組み合わせが特に重要になると指摘している。さらに、このアルゴリズムは他の構造的特徴を持つシーケンスの設計にも適用でき、ターゲットを絞ったコンタクトマップを持つシーケンスの設計の可能性を示しています。

タンパク質のAI、進化し続ける

科学者たちは1960年代からタンパク質を研究しており、その構造を決定するために主にX線や核磁気共鳴(NMR)などの従来の技術に頼ってきた。タンパク質の生化学的メカニズムに関する理解が深まり、コンピューティング技術が急速に進歩するにつれ、研究者はタンパク質の構造を予測するために計算手法に目を向けるようになりました。

2016 年、Xu Jinbo 氏のチームは、構造予測における深層残差ネットワーク (ResNet) の応用を開拓し、タンパク質残基の接触予測の精度を大幅に向上させました。この成果を基に、ResNetアーキテクチャを採用したAlphaFold(残基距離予測に重点を置く)やYang Jianyi氏とDavid Baker氏のチームが開発したtrRosetta(二面角情報などの導入に重点を置く)など、共進化とディープラーニングアルゴリズムを組み合わせた一連の研究が登場しました。

2020年、AlphaFold2はCASP14コンペティションで大きな注目を集め、98.5%の予測精度を達成しました。 2021年、David Baker氏のチームは、オープンソースのタンパク質予測ツール RoseTTAFold を Science 誌にリリースしました。このツールは、自然言語処理 (NLP) 技術を使用して、多重配列アライメント (MSA) から直接共進化情報を抽出します。その予測精度は CASP14 の AlphaFold2 に匹敵します。それ以来、タンパク質配列に基づく事前トレーニング済みモデル(タンパク質言語モデル (PLM) とも呼ばれる)が、タンパク質構造予測に広く使用されてきました。

2022年末、MetaはESM-2とESMFoldをリリースしました。これらは当時リリースされた中で最大かつ最も複雑なタンパク質言語モデルの1つとなりました。 2024年、David Baker氏のチームは、タンパク質、核酸、小分子、金属、化学修飾など、生物学的単位内のすべての原子の3D座標を正確に記述できる新しい構造予測方法であるRoseTTAFold All-Atom (RFAA)を立ち上げました。

人工知能(AI)は、タンパク質構造予測の分野で大きな進歩を遂げているほか、タンパク質と他の生体分子との相互作用の予測、タンパク質設計、プロテオミクスなど、タンパク質研究の他の多くの分野でも進歩を続けています。今後もAIは影響力を拡大し続け、タンパク質研究における多くのギャップを埋めていくでしょう。

<<:  有名なマジシャンが患っている「肺腺癌」とは一体何なのか?予防パンフレットはこちら→

>>:  数百万のIPが科学技術人材を育成し、国を強くする丨LiuGong:スマートグリーンマシンで人間の力を拡張

推薦する

一日三食のヘルシーレシピ

私たちが毎日必要とするエネルギーは毎日の食事から得られるため、適切な食品の組み合わせを摂ることが非常...

タラと脂の多い魚の違い

魚は私たちの食生活の中で比較的一般的であり、多くの人が魚を食べるのが好きですが、時には私たちが食べて...

海は優れた炭素捕捉器です!海洋炭素吸収源につい​​て学び、「デュアルカーボン」目標の達成に協力しましょう。

地球上の既知の生命はすべて、有機物としての炭素に基づいています。約38億年前、地球の初期の炭素ベース...

目が乾燥している場合は、目薬をさすだけでいいですか?

「目が乾燥しているので、目薬をさすだけでいいですか?」最近、電気製品を見ると目が乾燥する人が増えて...

誰もが自動車を作っているが、サムスンはそうする予定はない

自動車の知能化の波の中で、多くのテクノロジー大手が独自の自動車を製造する計画を立てているようだが、強...

野生動物が「都市に侵入」するケースが頻繁に発生しており、科学的共存の新しいモデルの構築が急務となっている。

今年に入ってから、シベリアトラが村を侵略し、アジアゾウが北上し、イノシシが南京を闊歩し、ノガンが北京...

マザーワートシチュー

マザーワート煮込み肉は、女性が栄養を補給し、エネルギーを補充するのに役立つオプションです。マザーワー...

中国自動車工業協会:2023年7月の自動車産業の生産と販売の簡単な分析

中国自動車工業協会の統計分析によると、7月は前年同期のベースが高かったことと、自動車市場が伝統的に閑...

「お湯を多く飲む」というのは本当に効果があるのでしょうか?それはあなたが思っているほど簡単ではありません。

「風邪をひいたの?」 「もっとお湯を飲んでください!」 「お腹に違和感を感じますか?」 「もっとお...

緑茶の副作用

私たちの日常生活では、緑茶を飲むのが好きな人がたくさんいます。特に休日に帰省するときは、両親や親戚に...

ちょっとした胃腸の病気だと思っていたら、実は癌だったんです!これらの人々に注意してください!タイムリーな検査は本当に命を救うことができる

胃の痛み、膨満感、胃酸の逆流、血便...単に「ちょっとした胃の不調」だと考える人もいる無視して我慢す...

揚げヘチマと枝豆の作り方

田舎では、ほとんどの家庭でヘチマと枝豆が栽培されています。ヘチマの薬効はよく知られており、枝豆も栄養...

カニの蒸し方

カニは魚介類の中でも珍味であり、どのような調理法で食べても美味しいカニ身と美味しいカニ卵を食べること...

自家製ポークシチュー

煮豚の主な材料は豚ヒレ肉です。豚ヒレ肉のカルシウム含有量は肉類の中で最も高く、また粗繊維も含まれてお...