本日、OpenAIは、今週中にChatGPT PlusおよびTeamユーザー全員に、新しい高度な音声モードを正式に公開すると発表しました。

image.png

公式発表によると、この新機能は、カスタム指示、記憶、5つの新しい音声、改良されたアクセントの追加だけでなく、5種類の異なる音声と50種類以上の言語オプションも追加され、ユーザーとChatGPTのやり取りをよりスムーズでパーソナライズされたものにします。

PlusまたはTeamユーザーの方は、高度な音声機能へのアクセス権限が付与されると、アプリケーション内に通知が表示されます。

image.png

OpenAIは、今回の音声モードの多様性を特に強調しており、落ち着いた、熱心な、才能のある、陽気ななど、5つの音声スタイルが追加され、ユーザーは状況に応じて最適な音声を選択できます。例は以下の通りです。

高度な音声は、高度な音声のカスタマイズ命令機能をサポートしており、個人のニーズに合わせて設定を行うことができます。公式の例は以下の通りです。

さらに、ユーザーは音声の速度(会話速度、流暢さ、アクセントなど)をカスタマイズして、やり取りをよりパーソナライズすることができます。公式の例は以下の通りです。

なお、高度な音声は、iOS/Androidモバイルアプリケーションでは1.2024.261以降のバージョンから利用可能です。高度な音声は、EU、英国、スイス、アイスランド、ノルウェー、リヒテンシュタインではまだ提供されていません。

高度な音声の使用にはいくつかの制限があります。

  •  高度な音声には、毎日の使用制限があります。15分以内に制限に達すると、警告が表示されます。

  • ユーザーは、GPTを高度な音声と同時に使用することはできません。

  • 高度な音声は中断されやすく、車載用には最適化されていません。

全体として、ChatGPTの音声の流暢さ、会話速度、アクセントは改善されており、さまざまなビジネスシーンに対応できます。この人間的な設計により、ChatGPTは多くの分野でより広く活用されることになるでしょう。

例えば、教育分野では、生徒は音声モードを使用してスピーキングの練習を行い、即時のフィードバックを得て、実際の人との会話感を体験できます。法律分野では、弁護士がこれを用いて法廷での弁論をシミュレートし、プレッシャーを軽減することができます。さらに、ビジネスパーソンはこれをビジネス交渉のシミュレーションに活用し、医療分野では医療アシスタントとして、患者の服薬や治療の追跡をリアルタイムでリマインダーすることができます。

重要なポイント:

🎤 高度な音声モードの公開:OpenAIは、ChatGPT PlusおよびTeamユーザー向けに、最大50言語をサポートする新しい音声モードをリリースします。

🎶 カスタマイズ可能なインタラクション:新しい機能により、ユーザーは音声スタイルと速度を選択し、パーソナライズされたコミュニケーションを行うことができます。

🌍 幅広い適用事例:音声モードは、教育、法律、ビジネス、医療など、多くの分野でユーザーエクスペリエンスを向上させるために使用できます。