ニュース

Google DeepMind、「Gemma 4」を発表 ~ライセンスは商用可能な「Apache 2.0」に

他のローカルモデルの1/20サイズで同等のパフォーマンス

Google、「Gemma 4」を発表

 米Google DeepMindは4月2日(現地時間)、新しいオープンモデルファミリー「Gemma 4」を発表した。前世代の「Gemini 3」を発展させたモデルで、高度な推論とエージェント型ワークフローに特化した設計になっているという。

 「Gemma 4」はスマートフォンからラップトップ、開発者向けワークステーションまでの幅広いハードウェアでの動作を想定しており、以下の4つのサイズで展開されている。

  • E2B:オンデバイス性能を重視し、高スループットと低メモリ使用を重視
  • E4B:「E2B」より少し大きいが、高性能
  • 26B A4B:全パラメーターを毎回動かす密結合モデルよりも計算量とメモリ使用を抑えられる「MoE」(Mixture of Experts)を採用し、小規模モデルの速度と大規模モデルの品質をあわせもつ
  • 31B:長文脈推論にも耐える256Kコンテキストウィンドウを備えた高性能モデル

 31Bモデルはオープンモデルの業界標準である「Arena AI」テキストリーダーボードで世界3位、26Bモデルは6位を獲得しており、「Gemma 4」より20倍大きいモデルに匹敵するパフォーマンスを発揮しているという。

他のローカルモデルの1/20サイズで同等のパフォーマンス

 「Gemma 4」は、すべてのモデルでテキストと画像・動画の入力をサポート。画像の縦横比を問わなずさまざまな解像度を柔軟に扱えるほか、OCR(光学文字認識)、文書解析、UI理解、チャート読み取りなども行える。また、140以上の言語でネイティブ学習されているとのこと。加えて、小型の「E2B」と「E4B」は音声入力も扱える。コンテキストウィンドウは「E2B」「E4B」が128Kトークン、「26B」「31B」が256Kトークン。

 「Gemma 4」で期待されているのは、クラウドのAIプロバイダーを利用しない、ローカルデバイスで完結するAIコードアシスタントとしての活用だ。「Gemma 4」はAndroid開発で訓練され、とくにエージェントモードを念頭に置いて設計されている。つまり、「Gemma 4」を「Android Studio」のローカルモデルにすれば、レガシーコードのリファクタリングやアプリ全体もしくは新機能の構築、修正の反復適用など、Android開発のさまざまなシナリオを「Gemma 4」に任せられる。

 また、「Gemma 4」は今年後半にも新しいフラッグシップAndroidデバイスへの搭載が予定されている「Gemini Nano 4」のベースにもなっている。「Gemini Nano 4」は前モデルより最大4倍の速度を発揮しながら、バッテリー消費を最大60%削減するという。

 これまでの「Gemma」シリーズには独自ライセンスによる商用制限があり、期待ほど採用が広がらないという問題があったが、「Gemma 4」はエコシステムの拡大を狙い、ライセンスが商用も可能な「Apache 2.0」へ変更される。Androidデバイス以外にも、さまざまなデバイスで活用が広がるだろう。

 「Gemma 4」モデルは現在、「Hugging Face」、「Kaggle」、「Ollama」などからダウンロード可能。「LM Studio」などのツールでも利用できる。