Google、Gemma 3をリリース ―Gemini 2.0の技術を利用し単一GPU上でのパフォーマンスを大幅に向上

Googleは2025年3月12日、軽量AIモデル「Gemma」の新バージョンGemma 3をリリースした。

Introducing Gemma 3: The most capable model you can run on a single GPU or TPU -Google Blog

Gemma 3 is a collection of lightweight, state-of-the-art open models built from the same research and technology that powers our Gemini 2.0 models. → https://t.co/lA6jOuri5d pic.twitter.com/wv0MDrCJiW
— Google AI Developers (@googleaidevs) March 12, 2025

Gemma 3はGemini 2.0を生み出したのと同じ研究によるテクノロジーを利用したモデル。128kトークンのコンテキストウィンドウを提供し、複雑なタスクを処理できる1B、4B、12B、27Bのサイズのモデルが用意されている。単一のGPUまたはTPU上で動作するAIモデルとして最高レベルのパフォーマンスを発揮し、LMArenaベンチマークでLlama-405B、DeepSeek-V3、OpenAI o3-miniを上回る評価を得たとのこと。

また高度なテキストおよび視覚的推論機能を備えたAIを作成可能で、画像、テキスト、ショート動画を解析するアプリケーションを構築できる。複数言語を話すアプリケーションも作成可能で、35以上の言語をすぐにサポートし、140を超える言語を事前トレーニング済みでサポート。関数呼び出しと構造化出力もサポートし、タスクを自動化してエージェントとして利用するシステムも構築可能。さらに量子化モデルが正式に採用され、高精度でありながらモデルサイズと計算資源の削減が可能となっている。

Gemma 3はGoogle AI Studio上ですぐに試すことができるほか、Google AI Studioから取得したAPIキーを使ってGoogle GenAI SDKでアプリケーションを試すことが可能。

また、Hugging Face、Ollama、KaggleからGemma 3モデルをダウンロードし、Hugging FaceのTransformersライブラリをはじめ任意の開発環境を使ってモデルをカスタマイズ、構築できる。

さらにVertex AIを使用して、カスタムしたGemma 3をデプロイしたり、Cloud Run GPUでOllamaを使用してLLM推論を実行や、NVIDIA APIカタログからGemma 3のNVIDIA NIMを使いはじめることもできる。