MetaのAIはタンパク質構造の研究方法に革命を起こす可能性がある

MetaのAIはタンパク質構造の研究方法に革命を起こす可能性がある

タンパク質は生物の活動を維持するために不可欠な要素です。細胞の修復、老廃物の除去、体の端から端への伝達を助けます。

科学者の間ではタンパク質の構造と機能を解明するための研究が盛んに行われており、この目的のために、Meta の AI 研究チームは本日、アミノ酸配列に基づいてタンパク質の 3D 構造を予測できるモデルを使用したことを発表しました。DeepMind などのこの分野でのこれまでの研究とは異なり、Meta の AI は形状と配列のマッチング アルゴリズムではなく、言語学習モデルに基づいています。Meta はこの研究に関するプレプリント論文を公開するだけでなく、モデルとタンパク質のデータベースの両方を研究コミュニティと業界に公開する予定です。

まず、タンパク質の形状を理解することの重要性を説明するために、簡単な生物学のレッスンを紹介します。遺伝子の特定のヌクレオチドのトリプレット配列は、細胞内のリボソームと呼ばれる分子によってアミノ酸に変換されます。タンパク質は、独自の形状と構成に自己分類されたアミノ酸の鎖です。メタゲノミクスと呼ばれる新しい科学分野では、遺伝子配列を使用して自然界の新しいタンパク質を発見、カタログ化、注釈付けしています。

Meta の AI モデルは、大規模言語モデルにヒントを得た新しいタンパク質折り畳みアプローチであり、メタゲノミクス データベース内の何億ものタンパク質配列の構造を予測することを目的としています。これらのタンパク質が形成する形状を理解することで、研究者はタンパク質がどのように機能し、どの分子と相互作用するかについての手がかりを得ることができます。

[関連: Meta は新しい AI ツールで Wikipedia の精度を高めることができると考えている]

「メタゲノミクスタンパク質の初めての大規模な特性評価を作成しました。タンパク質構造の予測が 6 億件以上あるデータベースをオープン サイエンス リソースとして公開します」と Meta AI の研究科学者アレックス リヴス氏は言います。「これは、世の中で最も理解されていないタンパク質のいくつかをカバーしています。」

歴史的に、計算生物学者は進化のパターンを利用してタンパク質の構造を予測してきました。タンパク質は、折り畳まれる前は、アミノ酸の線状鎖です。タンパク質が複雑な構造に折り畳まれると、線状鎖では離れているように見える特定の配列が、突然互いに非常に近くなる可能性があります。

「これは、パズルの 2 つのピースが合わさってできていると考えることができます。進化は、これらの 2 つの位置を独立して選択することはできません。間違ったピースがここにあると、構造が崩れてしまうからです」と Rives 氏は言います。「つまり、タンパク質配列のパターンを見ると、配列内の異なる位置が互いに共変するため、折り畳まれた構造に関する情報が含まれているということです。これは、タンパク質の根本的な生物学的特性に関する何かを反映することになります。」

一方、2018年に初めて登場したディープマインドの革新的なアプローチは、主に多重配列アライメントと呼ばれる手法に依存している。基本的には、タンパク質配列の大規模な進化データベースを検索し、予測対象のタンパク質に関連するタンパク質を見つける。

「私たちのアプローチが他と違うのは、複数の関連タンパク質のセットから予測してパターンを見るのではなく、アミノ酸配列から直接予測を行っていることです」と Rives 氏は言います。「言語モデルはこれらのパターンを別の方法で学習しました。つまり、この配列セットを処理する必要がなく、関連配列を検索する必要がないため、構造予測アーキテクチャを大幅に簡素化できるということです。」

これらの要素により、この分野の他の技術と比較して、彼らのモデルはより高速になる、とリヴス氏は主張する。

[関連: Meta は人間の脳を研究することで AI を改良したいと考えている]

このモデルをこのタスクを実行できるようにどのようにトレーニングしたのでしょうか。2 つのステップを踏みました。まず、構造が異なり、さまざまなタンパク質ファミリーに属し、進化のタイムライン全体にわたって得られた多数のタンパク質で言語モデルを事前トレーニングする必要がありました。彼らはマスク言語モデルのバージョンを使用し、アミノ酸配列の一部を空白にして、その空白を埋めるようにアルゴリズムに指示しました。「言語トレーニングは教師なし学習で、配列のみでトレーニングされます」と Rives 氏は説明します。「これを行うと、このモデルは数百万のタンパク質配列にわたってパターンを学習します。」

次に、言語モデルをフリーズし、その上でフォールディング モジュールをトレーニングしました。トレーニングの第 2 段階では、教師あり学習を使用します。教師あり学習データセットは、世界中の研究者が提出したタンパク質データバンクの構造のセットで構成されています。次に、AlphaFold (DeepMind のテクノロジー) を使用して作成された予測で補強されます。「このフォールディング モジュールは、言語モデルの入力を受け取り、基本的にタンパク質の 3D 原子座標を [アミノ酸配列から] 出力します」と Rives 氏は言います。「これにより、これらの表現が生成され、フォールディング ヘッドを使用して構造に投影されます。」

リヴス氏は、このモデルは、タンパク質の活性部位の機能を生化学レベルで理解するなどの研究用途に使用できると考えています。これは、新薬の開発や発見に非常に役立つ情報です。また、将来的には、この AI を使って新しいタンパク質を設計できるとも考えています。

<<:  今週末は流星群とハンターズムーンが夜空を照らすだろう

>>:  レモン汁をもっと搾る方法と、電子レンジを使った8つの天才的な裏ワザ

推薦する

スーパー T レックスと他の 3 種類の悪夢のような恐竜に会いましょう

恐竜の時代には、現在の北アメリカ大陸にあたる地域に、次々と大型肉食動物が君臨していた。最初は1億45...

科学者たちはついに、これらの素晴らしいサンゴが暗闇で光る理由を解明するかもしれない

サンゴ礁のLobophyllia hemprichiiの橙赤色の蛍光光変換タンパク質色素は、光合成共...

この小さなNASAの探査車は砂や険しい丘を征服できる

NASA のスピリット探査車は、火星の平原を 6 年間探査した後、2009 年 5 月にグセフ クレ...

火星の謎の球体は水の奇妙な働きかもしれない

火星の表面に現れた奇妙な新しい球体に、惑星地質学者たちは大騒ぎしている。水が原因かもしれないし、大き...

CDCがゾンビの黙示録を人々に大々的に宣伝した時

マシュー・ホンゴルツ・ヘトリング著『If It Sounds Like a Quack: A Jou...

現代のスカンジナビア人の中には、バイキングのような祖先の多様性を欠いている人もいる

ヴァイキングの歴史をいい加減に扱う映画やテレビシリーズが数多くあるにもかかわらず、科学者や歴史家は、...

目に見える宇宙、過去と現在

目に見える宇宙、過去と現在1608 年に望遠鏡が発明される前、私たちが宇宙について思い描いていたのは...

人間は互いに殴り合えるように対向親指を進化させたのか?

人間の手は人間らしさを決定づけるものだと考えられている。大きな脳と相まって、完全に反対方向に向いた親...

何でも聞いてください: 昆虫は太れますか?

太った虫に関する最初の研究は、フロリダの昆虫学者が肥満した蚊に関する研究を発表し始めた1960年代初...

男性にもホルモン周期はあるのでしょうか?

男性にもホルモン周期があることは明らかだ。男性のテストステロン値は、おそらく概日リズムに合わせて朝一...

エクソマーズ着陸船は何をするのでしょうか?

今日、火星では、13 年前のアメリカのロボットがクレーターから上を見上げ、新しいヨーロッパの仲間の到...

考古学者はついにラオスのジャール平原の謎の一部を解明した

ラオス北部の山の尾根と丘陵の斜面には、考古学最大の謎の一つが眠っている。約30平方マイルにわたって、...

なぜダンスが下手な人がいるのか

ジェシカ・フィリップス・シルバーは、ジョージタウン大学メディカルセンターの音楽神経科学の准研究員です...

人類の祖先の顔を再現する方法

↑エリザベス・デイネス、彫刻家、アトリエ・デイネス創設者、パリ30 年前、私は演劇用の超現実的なマス...

火星に生命は存在したのか?パーセベランスのSHERLOCレーザーが微視的な手がかりを探す

NASA の火星探査車パーサヴィアランスの車体には 12 台以上のカメラ (そして初めてマイクも) ...