ニュース

Google、「Gemma 3n」を発表 ~スマホでもローカル動作する高性能な生成AIモデル

音声、動画も扱える。日本語をはじめとする多言語対応も強化

Google、「Gemma 3n」を発表

 米Googleは5月20日(現地時間)、生成AIモデル「Gemma 3n」を発表した。同日より早期プレビューとして提供される。

 「Gemma 3n」はスマートフォンやラップトップ、タブレットといった比較的非力なデバイスへ最適化されたAIモデル。「Per-Layer Embedding」(PLE)と呼ばれるパラメーターをキャッシュしたり、大きなモデルのなかに入れ子のサブモデルを含む「MatFormer」アーキテクチャーで必要な部分のみパラメーターをアクティブにすることで計算コストを削減しており、ストレージやメモリの少ないデバイスでも品質を保ちつつ、高速な推論をローカルで行えるのが魅力だ。オフラインでも動作し、ユーザーのプライバシー保護にも役立つ。

パラメーターをキャッシュしたり、使わない部分を非アクティブにするなどの工夫で、高品質・高速・省メモリ動作を実現
比較的非力なデバイスへ最適化されたAIモデルながら、パフォーマンスは一般の大規模言語モデルに引けをとらない

 また、「Gemma 3n」は画像とテキストを組み合わせた分析・応答が行えるマルチモーダル理解が可能。音声入力の処理にも対応しており、書き起こしや翻訳、音声でのユーザーとのやり取りも得意だ。ビデオ理解も大幅に強化されているという。日本語など、多言語パフォーマンスも向上している。

 「Gemma 3n」は現在、「Google AI Studio」などで利用可能。オンデバイス開発のためのツールとライブラリも「Google AI Edge」で提供される。

「Gemma 3n」は現在、「Google AI Studio」などで利用可能