OpenAIは先日、有料ユーザー向けにChatGPTの高機能音声モード(AVM)の提供開始を発表しました。この大幅なアップデートは今週中に全面展開される予定です。
今回のアップデートでは、新しい音声オプションの追加に加え、カスタム指示と改良された音声インタラクション技術も導入され、ユーザーエクスペリエンスが大幅に向上しました。
現在、高機能音声機能はChatGPTのPlusおよびTeamレベルのユーザーのみに提供されています。対象となるユーザーはChatGPTモバイルアプリで通知を受け取ります。無料ユーザーは現時点ではこの機能を利用できません。
注目すべき点として、有料ユーザーは高機能音声機能の使用時間に制限があります。具体的な制限時間は変更される可能性があります。残りの使用時間が15分になるとシステムから通知があり、日々の制限に達すると、会話は自動的に標準音声モードに切り替わります。
今回のアップデートでは、多くの注目すべき新機能が追加されました。
5つの新しい音声スタイルの追加:OpenAIは、ChatGPTにVale、Spruce、Arbor、Maple、Solという5つの新しい音声オプションを追加しました。それぞれの音声は、落ち着いた、自信に満ちた、明るいなど、独特の特徴を持っており、ユーザーはよりパーソナライズされた選択ができます。
カスタム指示:ユーザーは、よりフォーマルな、よりフレンドリーな、またはよりユーモラスなトーンで会話するなど、自分の好みに合わせてChatGPTの音声応答方法をカスタマイズできるようになりました。
記憶機能:ChatGPTには、以前の会話内容を保持する記憶機能が追加され、より自然で一貫性のあるインタラクションが可能になりました。
改良されたアクセントと会話速度:音声出力の品質が大幅に向上し、アクセントがより自然になり、会話速度と流暢さも改善されました。
多言語対応:高機能音声モードは現在50以上の言語に対応しており、ChatGPTのグローバルユーザーベースを大幅に拡大しました。
さらに、OpenAIはAVMのインターフェースデザインも最適化しました。ユーザーインターフェースでは、以前のアニメーションの黒い点のデザインに代わって、青いアニメーションの球体がこの機能を表すようになりました。AVMが利用可能な場合、ユーザーはアプリケーションの音声アイコンの横にヒントウィンドウが表示されます。
なお、以前の春期アップデートで紹介されたビデオと画面共有機能はまだリリースされていません。これらの機能は、手書きの数学の問題へのリアルタイム回答やコードの記述など、システムが視覚情報と聴覚情報を同時に処理できるようにすることを目的としていました。現在、OpenAIはこれらのマルチモーダル機能の具体的なリリーススケジュールを発表していません。
OpenAIは、AVMの限定テスト以来、著しい進歩を遂げたと述べています。初期のテストではいくつかの不具合がありましたが、同社は現在状況が大幅に改善されたと主張しています。
ただし、この機能は現在、EU、英国、スイス、アイスランド、ノルウェー、リヒテンシュタインなど、いくつかの地域ではまだリリースされていません。