OpenAIは本日、ChatGPTの高度音声モード(Advanced Voice Mode、AVM)がWindowsとMacプラットフォームで正式に利用可能になったことを発表しました。この機能はGPT-4oモデルに基づいて開発されており、ユーザーは音声を通じてAIとより自然なリアルタイムの対話インタラクションを行うことができます。
AVMは今年7月にテストユーザー向けに初めて公開され、9月末にはChatGPT PlusとTeamの有料ユーザーに拡大されました。OpenAIは、無料ユーザーも将来的に利用できるようになると述べていますが、EU、英国、スイスなどのヨーロッパ地域のユーザーは現時点ではこの機能を利用できません。
今回のアップデートでは、OpenAIはArbor、Maple、Sol、Spruce、Valeの5つの音声オプションを追加し、インターフェースの黒いアニメーション点を青いアニメーション球体に変更しました。システムは、ユーザーが会話中に中断や一時停止を行うことをサポートし、より人間同士のコミュニケーションに近い会話体験を実現します。ただし、システムは1日の使用時間に制限があり、制限を超えると標準音声モードに自動的に切り替わります。
ユーザーのフィードバックによると、新機能は音声認識の精度と応答速度において良好なパフォーマンスを示しています。テストデータによると、プラットフォームに対するユーザーの全体的な満足度は96%、AIの回答精度は92%に達しています。
さらに、OpenAIは昨日、ChatGPTウェブ版のチャット履歴検索機能もリリースしました。ユーザーは以前の会話内容を検索して続けることができます。業界関係者は、これらのアップデートはOpenAIの音声インタラクション技術における継続的な進歩を示していると見ていますが、機能のさらなる改善と市場での普及効果はまだ観察が必要です。