生成AIの大手AnthropicやOpenAIとの激しい競争の中、GoogleはAIチャットボットGeminiの大幅なアップデートを発表しました。今回のアップデートは、プラットフォームのパフォーマンス向上と利用範囲の拡大に焦点を当てています。重要な変更点を見ていきましょう。

多言語対応、グローバル展開

今週木曜日から、Gemini 1.5 Flash(Googleが5月にリリースした軽量なマルチモーダルモデル)は、40言語に対応し、約230の国と地域でウェブとモバイルデバイスから利用可能になります。Googleによると、Gemini 1.5 Flashは、特に推論と画像理解において、品質と応答速度が大幅に向上したとのことです。

このアップデートは、ユーザーエクスペリエンスの向上だけでなく、Googleの運用コスト削減にもつながる可能性があります。Gemini 1.5 Flashは、Gemini 1.5 Proの「軽量版」かつ高効率版として説明されており、「低帯域幅」「高頻度」の生成AIワークロード向けに設計されています。

QQ截图20240726093143.png

出典:Google

コンテキストウィンドウの拡張、ファイルアップロード機能

新しい基本モデルに加えて、GoogleはGeminiのコンテキストウィンドウを32,000トークン(約24,000語、または48ページのテキストに相当)に拡張しました。これは、Geminiがより長いテキストを処理し、より一貫性のある会話体験を提供できることを意味します。

さらに注目すべきは、Google Driveとローカルデバイスからのファイルアップロード機能が、すべてのGeminiユーザー向けに間もなく公開されることです。ユーザーは学習資料をアップロードしてGeminiに練習問題を作成させたり、データファイルを分析して視覚化されたグラフを作成させたりすることができます。

透明性の向上、「幻覚」の軽減

AIモデルが「幻覚」(つまり、虚偽の情報をでっち上げる)を起こす可能性に対処するため、Googleは新しい機能をテストしています。それは、Geminiが生成した一部の回答の下に、関連するウェブコンテンツへのリンクを表示するというものです。この取り組みは、情報の信頼性と透明性を高めることを目的としています。

より広範なアプリケーションシナリオ

Googleは、Geminiの機能をさらに多くの分野に拡大しています。

1. Messagesアプリへの統合:Gemini機能は、欧州経済地域(EEA)、英国、スイスで展開され、フランス語、ポーランド語、スペイン語などの新しい言語に対応します。

2. モバイルアプリの普及:Geminiモバイルアプリは、より多くの国で展開されます。

3. 青少年への開放:Geminiは世界中で青少年向けに開放され、専用のオンボーディングプロセスと「AIリテラシーガイド」が導入されます。

Googleによる今回のGeminiの大幅なアップデートは、AI分野における同社の野心と決意を示しています。パフォーマンスの向上、言語サポートの拡大、新機能の追加、より広範なユーザーへの開放を通じて、Googleは競争の激しいAI市場でトップの座を維持しようと努めています。