アリババ、Qwen 2.5-Maxを発表 – DeepSeekに対応(AINEWS)

from AINEWS

アリババは、DeepSeekに対応する最先端のMoE(Mixture-of-Experts)大規模モデルであるQwen 2.5-Maxを発表した。Qwen 2.5-Maxは、20兆を超えるトークンの事前学習と、SFT(Supervised Fine-Tuning)やRLHF(Reinforcement Learning from Human Feedback)といった高度な技術により、さまざまなベンチマークで有望な結果を示し、DeepSeek V3などの競合を凌駕しています。

Qwen 2.5-Maxは現在、Alibaba CloudとQwen Chatを通じてアクセス可能で、開発者や研究者はそのブレークスルーを直接試すことができる。AIモデルのスケーリングに対するアリババのコミットメントは、性能ベンチマークを向上させるだけでなく、基本的な思考と推論能力を強化し、より高度な推論スキルのための強化学習の限界を押し広げることを目的としています。


*Disclamer:本キュレーションはAINEWSからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。

+ キュレーション元の記事を読む