Qwen3リリース ―小型モデルは10倍以上のパラメータをもつモデルを上回る性能を発揮

中国Alibabaは2025年4月29日、同社が開発するオープンな言語モデルQwenファミリの最新バージョンQwen3をリリースした。

今回リリースされたQwen3は2つのMoEモデルと6つの高密度モデル。いずれもウェイティング(重みつけ)をオープンにしており、Apache 2.0ライセンスの下で利用可能。フラッグシップとなるQwen3-235B-A22Bは総パラメータ数2350億、有効パラメータ数220億の大規模MoE(Mixture of Experts)モデル。128kのコンテキスト長をもち、コーディング、数学、一般機能などのベンチマーク評価においてDeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Proなど各社のトップクラスのモデルに匹敵する性能を達成しているという。

またQwen3-30B-A3Bは総パラメータ数300億、有効パラメータ数30億の小規模MoEモデル。アクティブパラメータが10倍のQwQ-32Bを凌駕する性能を発揮したとのこと。

Qwen3はQwen Chat Webで簡単に試すことができる。またソースはGitHubで公開されているほか、Qwen3-30B-A3Bなどの学習済みモデルと、ぞれぞれ対応する学習前のモデル(Qwen3-30B-A3B-Baseなど)は、Hugging FaceModelScopeKaggleなどのプラットフォームでも公開されている。

おすすめ記事

記事・ニュース一覧