from AASJ
ChatGPTが公開される前から、生命科学へのTransformer/attentionと呼ばれる生成AIモデルの導入が進められていました。その中でも最も注目すべき成果がGoogleの研究室から発表されたAlphaFoldです。AlphaFoldは物理化学に基づく構造予測を大幅に進化させ、2億種類の蛋白質構造を提供しています。このため、実際の構造を見たこともない蛋白質の構造を知ることができるようになりました。
9月13日には、AlphaFoldによって見える新しい世界を解析する2つの論文がNatureに発表されました。このうち、韓国ソウル国立大学とスイスチューリッヒ工科大学の研究では、2億種類の蛋白質構造を解析するアプリケーションの開発が行われ、新たな構造から見える世界が示されました。
具体的には、AlphaFoldは既に解析された36万種類の構造と92%の一致率を持ち、信頼性の高い構造データベースとして利用されています。しかし、これまでの研究では約40万種類の構造を扱ってきましたが、2億を超える新たな構造の相同性やドメイン機能を解析するには非常に時間がかかるため、モンスターCPUを使用しても10年以上かかると言われています。
そこで、この研究では、AlphaFoldデータベースから予測された構造の中で50%の一致と90%のアラインメントが取れる構造に限定し、5日間で5000万の相同クラスターを特定するアプリケーション「Foldseek」を開発しました。Foldseekにより、2億の蛋白質は200万のクラスターに分類され、そのうち31%は構造的なアノテーションが行われていません。
この研究ではさまざまな新たな世界が示されています。例えば、これまでアノテーションが行われていなかった蛋白質の機能が予測できるようになったり、進化の研究において古い構造や共通の構造が見つかったりしています。さらに、自然免疫に関わる分子やDNAセンサーの進化に関する新たな知見も得られています。
この研究は、蛋白質の機能や進化研究において新たな展望を開くものであり、興味深い成果が得られています。
*Disclamer:本キュレーションはAASJからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。
Curated. ニュースレター