from AASJ
αFold2は、アミノ酸配列から蛋白質の立体構造を予測するモデルで、大規模言語モデルの基盤Transformer/attentionモデルを使って成功した言語モデルです。このモデルは、一つのアミノ酸配列に対して一つの構造を予測するシステムですが、蛋白質の中には複数の構造を取り得る分子も存在します。
この論文では、複数の構造をモデル化する方法が示され、新しい構造の予測も可能であることが示されています。具体的な方法としては、アミノ酸配列データベースから複数の配列を抜き出し、それらを結び付けることで3次元構造が浮かび上がるように設計されています。さらに、複数の安定構造を取る分子については、異なる構造モデルが提供され、アミノ酸変換によって構造のスイッチが可能であることも示されています。
また、他の構造可能性が知られていない分子についても、アラインメントを変えることで新しい構造が予測されることが示されています。要するに、コンテクストを変えることで結果が変わるということであり、大規模言語モデルを活用する上での鍵となる要素と言えます。
*Disclamer:本キュレーションはAASJからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。
Curated. ニュースレター