グーグルは最近、AI分野で再び力強い動きを見せ、最新のGemini1.5モデルを発表しました。このバージョンには、小型バリアントのGemini1.5Flash-8Bと、「大幅な改良」が施されたGemini1.5Flash、「より強力な」Gemini1.5Proが含まれています。

image.png

グーグルによると、多くの内部ベンチマークテストと比較して性能が向上しており、Gemini1.5Flashの総合的な性能は「大幅に向上」し、1.5Proは数学、コーディング、複雑なプロンプトにおいてはるかに優れた性能を発揮しています。

グーグルのAI製品責任者であるLogan Kilpatrick氏はソーシャルメディアで、「Gemini1.5Flashは現在、世界中の開発者にとって最良の選択肢です!」と述べています。Gemini1.5シリーズモデルは長文を処理でき、1,000万を超えるトークンの情報で推論を行うことができるため、ドキュメント、ビデオ、オーディオなど、大量のマルチモーダル入力を処理できます。

Geminiモデルの「最新の試験的イテレーション」

グーグルは5月に、Gemini1.5の軽量版であるGemini1.5Flashを発表しました。Gemini1.5シリーズモデルは、長いコンテキストを処理し、1,000万以上のトークンからの詳細な情報を推論することができます。これにより、モデルはドキュメント、ビデオ、オーディオなど、大容量のマルチモーダル入力を処理できます。

今回、グーグルはパラメータ数が80億個のGemini1.5Flash小型版を発表しました。新しいGemini1.5Proは、コーディングと複雑なプロンプトの処理における性能が大幅に向上しています。Kilpatrick氏によると、グーグルは今後数週間以内に本番環境で使用できるバージョンをリリースし、より多くの評価ツールを提供したいと考えています。

Kilpatrick氏によると、これらの試験的モデルのリリースは、フィードバックを収集し、開発者に最新のアップデートをより迅速に提供するために行われています。彼は、新しいモデルは開発者向けに無料で提供され、Google AI StudioとGemini APIを通じてテストでき、将来的にはVertex AIの実験的エンドポイントを通じて提供されることを明らかにしました。

リリースから数時間後、大規模言語モデルシステム組織(LMSO)は、2万件のコミュニティ投票に基づいて、チャットボット分野のランキング更新を発表しました。Gemini1.5-Flashは「飛躍的な進歩」を遂げ、23位から6位に上昇し、Llamaと同等のレベルに達し、GoogleのGemmaオープンソースモデルを上回る性能を示しました。

image.png

9月3日以降、グーグルはリクエストを自動的に新しいモデルに転送し、混乱を避けるために旧バージョンを削除します。Kilpatrick氏は、この新しいモデルに大きな期待を寄せており、開発者がこれを利用してより多くのマルチモーダルアプリケーションを実現することを期待しています。

しかし、新しいモデルのリリースに伴い、初期のフィードバックは二極化傾向を示しています。一部のユーザーは頻繁なアップデートに疑問を呈し、ユーザーが期待しているのはより包括的なGemini2.0バージョンであると考えています。一方、アップデートの速度と性能を高く評価し、これによりグーグルがAI分野で優位性を維持していると考えるユーザーもいます。

要点:  

✨ 新しく発表されたGemini1.5シリーズモデルは、数学、プログラミング、複雑なプロンプトにおいて顕著な向上を示しています。  

🚀 Gemini1.5Flashは1,000万を超えるトークンのマルチモーダル入力を処理でき、高い適応性を備えています。  

🛠️ ユーザーからのフィードバックは二極化しており、一部はGemini2.0の全面的なアップグレードを期待し、他は現在のアップデートを高く評価しています。