from AASJ
ChatGPTが公開される前から、生命科学へのTransformer/attentionと呼ばれる生成AIモデルの導入が進められていました。その中でも、Googleの研究室から発表されたAlphaFoldは大きな成果を上げ、物理化学に基づく構造予測をほぼ過去のものにしました。現在、AlphaFoldデータベースでは2億種類の蛋白質構造が閲覧可能であり、実際に見たことのない蛋白質の構造が提供されています。
9月13日、NatureにはAlphaFoldから見える新しい世界を解析する2つの論文が発表されました。このうち、韓国ソウル国立大学とスイスチューリッヒ工科大学からの論文は、2億種類の蛋白質構造を解析するアプリケーションを開発し、新たな世界を示しました。具体的には、予測された構造を既知の蛋白質のスケールで分類する手法を提案しています。
AlphaFoldは既に解析された36万種類の構造と92%の一致率を持ち、信頼性の高い構造データベースとして利用されています。しかし、新たに予測された2億以上の構造の相同性や機能を解析するには、モンスターCPUでも10年以上かかると言われています。そのため、ほとんどの蛋白質はアノテーションが行われずに捨てられています。
この研究チームは、まずAlphaFoldデータベースから50%の一致と90%のアラインメントが取れる構造に限定し、Foldseekというアプリケーションを開発しました。Foldseekにより、2億の蛋白質が200万のクラスターに分類され、そのうち31%は構造的なアノテーションが行われていません。また、アノテーションが行われていない蛋白質は全体の4%程度であり、これまでの構造研究で多くの新しい知見が得られています。
この研究では、AlphaFoldの解析により新たな世界が明らかにされています。具体的には、アノテーションが行われていなかった蛋白質の機能予測や、進化に関する知見が得られました。さらに、ヒトとバクテリアで共通する分子や自然免疫に関わる分子などの相同性が明らかになりました。
これらの研究結果は、蛋白質の機能や進化について新たな視点を提供しており、興味深いものです。論文を読むことで、蛋白質の研究において全く新しい世界が見える実感を得ることができます。
*Disclamer:本キュレーションはAASJからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。
Curated. ニュースレター