ロンドンのDeepMind本社にて、Google Cloudが高清音声モデル「Chirp3」を正式発表しました。このモデルは、Vertex AI統合機械学習プラットフォームを通じて開発者に公開され、豊富な開発ツールを提供することで、革新的なプログラム開発を支援します。
Chirp3は248種類の異なる音声に対応し、31言語での音声合成が可能です。開発者はこのモデルを利用して、スマート音声アシスタント、オーディオブック、動画の吹き替えなど、様々なアプリケーションを作成できます。Googleは、Chirp3の音声機能が人間の微妙な声の調子を捉えることができ、会話により自然で魅力的なものになると述べています。
既製の音声を使用する以外にも、Google Cloudのテキスト読み上げAPIを通じてカスタム音声を作成できます。ただし、Googleは責任ある利用を確保するために、潜在的な悪用を防ぎ、倫理的なAIの実践を遵守するため、この音声クローン機能へのアクセスを制限しています。
発表会で、Google CloudのCEOであるトーマス・クリアン(Thomas Kurian)は、Googleの全体的なビジョンはChirp3に加え、Gemini、Imagen、Veilなど、幅広いモデルを提供することだと強調しました。また、ビジネスユーザー向けに設計された新しい製品「Agent Space」も発表されました。
Google DeepMindのCEOであるデミス・ハサビス卿(Sir Demis Hassabis)も、特にマルチモーダル理解能力に関するGeminiの進化について説明しました。AI Studioでは、YouTubeのリンクを投稿すると、Geminiが動画の内容を処理し、長いコンテキストウィンドウを利用してユーザーからの質問に答え、講義やスポーツイベントの重要な瞬間をすばやく見つけることができると述べました。
さらに、Googleは英国のAIスキル向上のための包括的なトレーニングプログラムを実施する計画を発表しました。これは、専門家がAI技術を効果的に習得できるよう支援することを目的としています。Googleは英国のスタートアップ企業にクラウドインフラストラクチャとAIツールの利用クレジットを提供し、革新的なソリューションの迅速な開発と拡大を支援することで、起業活動を促進します。
プライバシーとコンプライアンスに関して、Googleはデータの保管に関するコミットメントを改めて表明しました。Vertex AIとAgent Space AIツールは、組織が地域の法律を遵守しながら、モデルのトレーニングとサービスを行うのに役立ちます。これは、プライバシーとコンプライアンスの要件が非常に高い医療や金融業界にとって非常に重要です。
プロジェクト:https://cloud.google.com/text-to-speech/docs/chirp3-hd
要点:
🌟 Google CloudがChirp3音声モデルを発表。248種類の音声と31言語に対応し、開発者がスマートアプリケーションを構築するのを支援します。
🔒 Googleは倫理的なAIの実践と悪用防止のため、音声クローン機能へのアクセスを制限しています。
💼 Googleは英国のAIスキル向上のための計画を開始し、スタートアップ企業にクラウドインフラストラクチャのサポートを提供してイノベーションを促進します。