ニュース
「Gemini 2.5」で最速・最安の「Flash-Lite」が登場、「Flash」「Pro」は一般提供開始
「Gemini 2.5 Flash」はシンプルな料金プランに
2025年6月18日 10:07
米Googleは6月17日(現地時間)、「Gemini 2.5」モデルファミリーを拡充したと発表した。プレビュー提供していたモデルの一般提供や、新しい派生モデルがアナウンスされている。
- Gemini 2.5 Pro:アップグレードバージョン(06-05 preview)がプレビュー版から一般提供(安定版)に
- Gemini 2.5 Flash:プレビュー(05-20 preview)が一般提供に。価格も改訂
- Gemini 2.5 Flash-Lite:プレビューとして提供
コストと速度をを突き詰めた推論モデル「Gemini 2.5 Flash-Lite」
「Gemini 2.5 Flash-Lite」は、「Gemini 2.5」ファミリーのなかでもっとも応答性(レイテンシ)とコストパフォーマンスに優れる新しいモデルで、従来の「1.5 Flash」「2.0 Flash」の後継といえる。ほとんどの場面で性能が向上しており、ファーストトークンまでの時間が短縮されるとともに、1秒あたりのデコードトークン数が増加しているとのことで、大規模な分類や要約のような高スループットのタスクに最適だ。関数呼び出しに加え「Google」検索によるグラウンディング(根拠付け)、コード実行、URLコンテキストなどのネイティブツールもすべてサポートしている。
なお、「Gemini 2.5 Flash-Lite」は他のモデルファミリーと同様に推論モデルとなっており、どれだけ深く思考するかをAPIパラメーターで動的にコントロールできる。ただし、「Flash-Lite」はコストと速度を優先するため、「思考」(thinking)は既定で無効化されている。
「Gemini 2.5 Flash」の一般提供と価格改定
「Gemini 2.5 Flash」が発表された当初、「2.5 Flash-Lite」の機能はまだ確定していなかった。また、「思考する」「思考しない」をわけて値付けしたことも開発者の混乱を招いたという。
そこで、思考型と非思考型の価格差をなくしたシンプルな料金プランに改定されることになった(以下はオーディオ以外の場合)。
- 0.30ドル/1M入力トークン(値上げ、入力トークンの数にかかわらず同じ料金)
- 2.50ドル/1M出力トークン(3.50米ドルから値下げ)
なお、「Gemini 2.5 Flash Preview 04-17」を利用中の場合、既存のプレビュー価格は2025年7月15日に予定されている廃止まで有効。一般提供される「gemini-2.5-flash」に移行するか、より低コストな「2.5 Flash-Lite Preview」への切り替えが推奨されている。