先日、Googleは最も経済的なモデルであるGemini 2.0 Flash-Liteを発表し、正式に商用利用が可能となりました。Gemini 2.0 Flash-LiteはGoogle Geminiシリーズの一部であり、コスト効率を重視した選択肢として位置付けられています。このモデルはGoogle AI StudioとVertex AIでパブリックプレビューとして提供され、高コスパなAIソリューションを必要とする開発者をターゲットとしています。
軽量化を重視した設計となっており、予算が限られているチームやスタートアップ企業に最適です。特に大規模なテキスト出力タスクにおいて優れたパフォーマンスを発揮します。
価格設定もこのモデルの大きな魅力です。Gemini 2.0 Flash-Liteの入力トークンは100万トークンあたり0.075ドル、出力トークンは100万トークンあたり0.30ドルです。この価格設定により、市場において高い競争力を持ちます。例えば、OpenAIのGPT-4 o-mini(入力0.15ドル/100万トークン、出力0.60ドル/100万トークン)と比較して、低コストです。
性能面では、Geminiシリーズの利点を継承しており、コンテキストウィンドウは100万トークンに達し、大量のデータ処理が可能です。ほとんどのベンチマークテストでGemini 1.5 Flashを上回り、同等の速度とコストで、特に高頻度タスクに適しています。
Gemini 2.0 Flash-Liteはマルチモーダル入力をサポートしますが、2.0 Flashと比較して、画像や音声出力はサポートしておらず、「検索をツールとして」や「コード実行をツールとして」といった高度な機能もありません。そのため、テキスト生成タスクに特化しており、迅速かつ低コストなソリューションが必要な場面に適しています。約4万枚の写真に1行のキャプションを生成するのに1ドル未満で済むことから、実用的な効率の高さがわかります。
Googleのこの動きは、OpenAI、Anthropicなどの競合他社との競争において、同社のAI戦略の更なる拡大と見なされています。