AlphaFoldによる新たな蛋白質構造の解析とアプリケーション開発(AASJ)

from AASJ

ChatGPT以前から、生命科学へのTransformer/attentionと呼ばれる生成AIモデルの導入が進んでいました。その中でも、Googleの研究室から発表されたAlphaFoldは、従来の物理化学に基づく構造予測を大きく上回る成果を収めました。現在、AlphaFoldデータベースでは2億種類の蛋白質構造が閲覧できるようになっており、実際の構造を見たこともない蛋白質の構造が提供されています。

9月13日には、AlphaFoldによって見える新しい世界を解析する2つの論文がNatureに発表されました。今回紹介する論文は、韓国ソウル国立大学とスイスチューリッヒ工科大学の研究チームによって行われ、2億種類の蛋白質構造を解析するアプリケーションの開発と、新たに見える世界を示す研究です。

この研究では、AlphaFoldデータベースから5日間で5000万の相同クラスターを特定するためのアプリケーション「Foldseek」が開発されました。Foldseekにより、2億の蛋白質は200万のクラスターに分類されました。そのうち31%は構造的なアノテーションが行われておらず、新たな知見が得られました。

この研究により、これまでアノテーションが行われていなかった蛋白質の機能や進化に関する情報が予測できるようになりました。また、新たに見つかった構造の進化についても調査され、古細菌や真核生物など、系統学的に古い構造が多く見つかりました。さらに、ヒトとバクテリアで共通する構造や自然免疫に関わる分子についても新たな知見が得られました。


*Disclamer:本キュレーションはAASJからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。

+ キュレーション元の記事を読む