Google Cloud hat auf einer Veranstaltung im DeepMind-Hauptquartier in London sein hochmodernes Sprachmodell Chirp3 offiziell vorgestellt. Das Modell wird über die Vertex AI-Plattform für einheitliches maschinelles Lernen für Entwickler zugänglich gemacht und bietet umfangreiche Entwicklungstools zur Förderung von Innovationen in Programmen.

QQ_1742262673191.png

Chirp3 unterstützt 248 verschiedene Stimmen und ermöglicht die Sprachsynthese in 31 Sprachen. Entwickler können dieses Modell nutzen, um verschiedene Anwendungen zu erstellen, wie z. B. intelligente Sprachassistenten, Hörbücher und die Sprachausgabe von Videos. Google erklärt, dass die Sprachfunktionen von Chirp3 subtile Nuancen menschlicher Stimmungen erfassen können, wodurch Dialoge lebendiger und ansprechender werden.

Neben der Verwendung vorgefertigter Stimmen können Benutzer über die Text-to-Speech-API von Google Cloud auch benutzerdefinierte Stimmen erstellen. Um verantwortungsvollen Umgang zu gewährleisten, beschränkt Google jedoch den Zugriff auf diese Sprachklonfunktion, um potenziellen Missbrauch zu verhindern und ethische KI-Praktiken sicherzustellen.

Auf der Veranstaltung betonte Thomas Kurian, CEO von Google Cloud, die Gesamtvision von Google, eine breite Palette von Modellen anzubieten, darunter neben Chirp3 auch Gemini, Imagen und Veil. Google hat außerdem ein neues Produkt namens Agent Space vorgestellt, das speziell für Geschäftskunden entwickelt wurde, um deren spezifischen Anforderungen gerecht zu werden.

Sir Demis Hassabis, CEO von Google DeepMind, stellte auch die Weiterentwicklung von Gemini vor, insbesondere seine Fähigkeiten zum multimodalen Verständnis. Er erwähnte, dass Benutzer in AI Studio YouTube-Links veröffentlichen können, wobei Gemini Videoinhalte verarbeiten, das lange Kontextfenster nutzen und Fragen stellen kann, um schnell wichtige Momente in Vorträgen oder Sportveranstaltungen zu finden.

Darüber hinaus kündigte Google eine Initiative an, um die KI-Kompetenzen in Großbritannien durch umfassende Schulungsprogramme zu verbessern und Fachkräften zu helfen, KI-Technologien effektiv zu beherrschen. Google wird britischen Start-ups Guthaben für die Nutzung von Cloud-Infrastruktur und KI-Tools zur Verfügung stellen, um die schnelle Entwicklung und Skalierung innovativer Lösungen zu unterstützen und so die Gründung von Unternehmen anzukurbeln.

In Bezug auf Datenschutz und Compliance bekräftigte Google sein Engagement für die Datenhoheit. Seine Vertex AI- und Agent Space AI-Tools helfen Organisationen, Modelle zu trainieren und bereitzustellen, wobei die Einhaltung der lokalen Gesetze gewährleistet wird. Dies ist besonders wichtig für Branchen wie das Gesundheitswesen und den Finanzsektor, die sehr hohe Anforderungen an Datenschutz und Compliance stellen.

Projekt: https://cloud.google.com/text-to-speech/docs/chirp3-hd

Wichtigste Punkte:

🌟 Google Cloud präsentiert Chirp3, ein Sprachmodell mit 248 Stimmen und 31 Sprachen, das Entwicklern bei der Erstellung intelligenter Anwendungen hilft.   

🔒 Google beschränkt den Zugriff auf die Sprachklonfunktion, um ethische KI-Praktiken zu gewährleisten und Missbrauch zu verhindern.   

💼 Google startet eine Initiative zur Verbesserung der KI-Kompetenzen in Großbritannien und unterstützt Start-ups mit Cloud-Infrastruktur, um Innovationen zu fördern.