from AASJ
ChatGPTの前から、生命科学へのTransformer/attentionと呼ばれる生成AIモデルの導入が進められていました。その中でも最も重要な成果が、Googleの研究室から発表されたAlphaFoldで、これまでの物理化学に基づく構造予測をほぼ過去のものにしました。現在、AlphaFoldデータベースでは2億種類の蛋白質構造が閲覧できるようになっています。
9月13日には、AlphaFoldから見える新たな世界を解析する2つの論文がNatureに発表されました。そのうちの1つは韓国ソウル国立大学とスイスチューリッヒ工科大学からのもので、2億種類の蛋白質構造を解析するアプリケーションを開発し、新たな構造から見える世界を示しました。
具体的には、AlphaFoldは既に解析された36万種類の構造と92%の一致率を持ち、信頼できる構造データベースとして利用されています。しかし、新たに予測された2億以上の構造の相同性や機能を解析するには、モンスターCPUでも10年以上かかると言われています。その結果、多くの蛋白質がアノテーションができないまま捨て置かれています。
この研究では、まずAlphaFoldデータベースから50%の一致と90%のアラインメントが取れる構造に限定し、5日間で5000万の相同クラスターを特定するためのFoldseekというアプリケーションを開発しました。Foldseekにより、2億の蛋白質は200万のクラスターに分類され、そのうち31%は構造的アノテーションが行われていません。
この研究では、AlphaFoldによって見えてきた新たな世界のいくつかの例も紹介されています。例えば、アノテーションができていなかった蛋白質の機能が予測できるようになったり、進化の研究において古い構造が多く見つかったりするなど、蛋白質の構造研究において新たな発見がありました。
以上のように、AlphaFoldによって見えてきた新たな世界は、蛋白質の機能や進化の研究において非常に重要な情報を提供しています。
*Disclamer:本キュレーションはAASJからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。
Curated. ニュースレター