from AASJ
ChatGPTが公開される前から、生命科学において生成AIモデルであるTransformer/attentionが利用されてきました。その中でも最も重要な成果がGoogleの研究室から発表されたAlphaFoldです。AlphaFoldは従来の物理化学に基づく構造予測を大きく進化させ、2億種類の蛋白質構造を提供するデータベースとして利用されています。このデータベースは、実際には見たことのない蛋白質の構造も提供しています。
2021年9月13日には、AlphaFoldから見える新しい世界に関する2つの論文がNatureに発表されました。今回紹介する論文は、韓国ソウル国立大学とスイスチューリッヒ工科大学の研究チームによるもので、2億種類の蛋白質構造を解析し、新たな世界を示すアプリケーションの開発について述べられています。
AlphaFoldは既に36万種類の構造を解析し、92%の一致率を持っており、信頼性の高い構造データベースとして利用されています。しかし、新たに予測された2億種類以上の構造の相同性や機能を解析するには、計算機の性能が必要であり、モンスターCPUでも10年以上かかるとされています。そのため、多くの蛋白質はアノテーションが行われずに放置されています。
この研究チームは、AlphaFoldデータベースから一致率が50%以上でアラインメントが90%以上取れる構造に限定し、新たなアプリケーションであるFoldseekを開発しました。Foldseekにより、2億種類の蛋白質が200万のクラスターに分類され、そのうち31%は構造的にアノテーションが行われていません。これにより、多くの蛋白質の機能や進化に関する新たな情報が明らかになりました。
具体的な例としては、アノテーションが行われていなかった蛋白質の機能が予測できるようになったことや、進化の調査により、系統学的に古い構造が多く見つかり、細菌や古細菌、真核生物で共通の構造も見られることが挙げられます。また、自然免疫に関わる分子やDNAセンサーの進化に関する新たな発見もあります。
以上が、AlphaFoldにより見えてきた新たな蛋白質の構造や機能についての要点です。この研究により、蛋白質の機能や進化に関する研究において、全く新しい展望が得られることが期待されています。
*Disclamer:本キュレーションはAASJからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。
Curated. ニュースレター