ニュース

グーグル、最速モデル「Gemini 2.5 Flash-Lite」正式公開

2025年7月23日 12:55

Googleは、大規模言語モデル「Gemini 2.5 Flash-Lite」の安定版を正式に公開した。Gemini 2.5モデルファミリーのなかで最速かつ低価格とし、100万トークンあたり入力0.10ドル、出力0.40ドルとなる。

これまでで最もコスト効率が高く、最速の2.5モデルとしており、推論機能はデフォルトでオフの状態でレスポンスの高い運用が可能。必要に応じて推論をオンにできる。

特に翻訳や分類など、遅延が課題になるタスクで品質を犠牲にすることなくパフォーマンスとコストの両立が可能。幅広いプロンプトによる実証では、2.0 Flash-Liteと、2.0 Flashの両方よりも低遅延を実現した。

コーディング、数学、科学、推論、マルチモーダル理解など、幅広いベンチマークでも2.0 Flash-Liteより総合的に高い品質を実証したという。Gemini 2.5 Flash-Liteは、Google AI StudioとVertex AIから利用可能

100万トークンあたり入力0.10ドル、出力0.40ドルの低コストに加え、オーディオ入力時の料金もプレビュー開始時から40%引き下げられている。