先日、Google I/OカンファレンスでGoogleが発表した新機能と製品は、大きな期待を集めています。大部分はまだリリースされていませんが、開発中の様子を垣間見ることができます。Googleは7月15日と7月18日に5つのGemini製品をリリースする予定で、早速見ていきましょう!

image.png

フロントエンドコードのリバースエンジニアリングと関連するリーク情報から、リリース予定のGemini製品は、新版Imagen3、GeminiカスタムGPT、パーソナライズされた応答機能、予約プロンプト機能、音声録音とGoogleフォトの統合などを含む可能性があると推測されます。さらに、リアルタイム強化機能やGemini Chrome拡張機能の開発も進んでいるようです。

Imagen3

Imagen3は、AI Labsのアルファテスター向けに公開され、最終的にはGemini Advancedユーザーにも公開される予定です。来週リリースされる可能性は低いですが、Imagen2の品質と、欧州連合で画像生成機能が不足していることを考えると、非常に期待されるバージョンです。AI Labs Discordメンバーと上級サブスクライバーに最初の招待状が送られるという噂もあります。

GEMs

GeminiのカスタムGPTであるGEM(以前は「Bot」と呼ばれていました)は、I/O発表前から開発されていました。ユーザーはGEMの閲覧、編集、複製が可能になり、これらの操作はGEMs Managerタブからアクセスできます。開発期間が長いため、GEMsは重要なバージョンになる可能性がありますが、遅延する可能性もあります。

image.png

記憶/パーソナライズされた応答機能

この機能は、サイドメニューにGemini応答アイコンの後ろにある独立したセクションとして表示されます。ツールチップによると、このボタンを使用するとユーザーはプロンプトをスケジュールできるようです。専用のタブでは、スケジュールされたタスクの一覧が表示される可能性があります。このユニークな機能により、ユーザーはGeminiに毎朝ニュースを送信するよう依頼でき、GEMと組み合わせると非常に効果的です。

image.png

プリセットプロンプト

この機能はコード内にしばらく存在しており、ChatGPTの記憶機能と同様の機能を持つと予想されます。ユーザーは設定でパーソナライズされたセクションにアクセスするための専用オプションを持つことになります。ただし、このセクションは「パーソナライズされた応答」という名前であるため、調整が行われる可能性があります。

image.png

音声録音とGoogleフォトの統合

添付ファイルオプションには、2つの追加機能があります。

  • 音声録音:ユーザーはメッセージを録音して.wavファイルとして送信できます。音声録音機能は実現可能と思われますが、リリースまでにはまだ時間がかかりそうです。
  • Googleフォトの統合:ほぼ完成しており、ユーザーはWeb上のフォトアプリから直接写真を選択できます。ただし、複数の画像を一度にアップロードできない問題は依然として解決されていません。

image.png

リアルタイムプロンプト強化機能

新しい非表示ボタンは、その外観と名前から、プロンプトの強化機能を果たす可能性があります。

image.png

さらに、以前にはAndroid版Geminiの追加機能が発見されており、GoogleはiOS版Googleアプリのベータテスターも募集していることから、iOS版Geminiのアップデートが間近に迫っている可能性を示唆しています。また、今後のアップデートではリアルタイム応答機能の無効化が含まれる可能性があります。

image.png

Geminiは、Googleの最新かつ最先端の人工知能モデルとして、人工知能能力の飛躍的な進歩を示しており、その機能と適用範囲は拡大を続けています。

要点:

🔍 Google GeminiがImagen3、GeminiカスタムGPTなどを含む新機能をリリース予定

🔍 パーソナライズされた応答、予約プロンプト、音声録音、Googleフォト統合などの機能も追加される見込み

🔍 GoogleはiOS版Geminiのベータテスターの募集を強化しており、iOSアップデートが間近に迫っている可能性が高い