ニュース

Google、「Gemma 3」を発表 ~単一GPU/TPUにおさまるものとしてはもっとも高性能

「Gemini 2.0」の成果をベースに視覚対応、ロングコンテキスト、エージェント対応

Google、「Gemma 3」を発表。「Google AI Studio」などで体験できる

 米Googleは3月12日(現地時間)、「Gemma」ファミリーの新モデル「Gemma 3」を発表した。「Gemini 2.0」と同じ研究および技術をベースとした軽量・最先端のオープンモデルコレクションで、単一のGPU/TPUで実行できるものとしてはもっとも高性能なモデルになるという。

 「Gemma 3」は、テキストだけでなく高度な視覚的推論機能も統合したマルチモーダルモデルで、画像や短いビデオも扱える。テキストに関しても、140の言語に対応。コンテキストウィンドウも128kトークンにまで拡張されており、膨大な量の情報を処理できる。

 また、タスクの自動化・エージェント化も見据えた設計になっており、関数呼び出しと構造化された出力をサポートする。将来的には公式の量子化バージョンを導入し、高い精度を維持しつつモデルサイズと計算要件の削除を実現する予定だという。

「Chatbot Arena Elo」のスコア。GPU要件(グラフ下の点)が1つでも、高いパフォーマンスを発揮する

 「Gemma 3」シリーズは、スマートフォンからラップトップ、ワークステーションまでをカバーするべく、さまざまなサイズ(1B、4B、12B、27B)が用意されている。これにより、手持ちのハードウェアパフォーマンスやニーズに最適なモデルを選ぶことができる。

 さらに、「Gemma 3」の発表に合わせて「ShieldGemma 2」もアナウンスされた。これは「Gemma 3」を基盤に構築された強力な4B画像安全チェッカーで、危険なコンテンツ、性的に露骨なコンテンツ、暴力の3つのカテゴリで画像をラベル付けする。既存のソリューションに統合し、不適切なコンテンツの排除に役立てることができる。