Google Cloud presentó oficialmente su modelo de lenguaje de alta definición Chirp3 en un evento celebrado en la sede de DeepMind en Londres. Este modelo está disponible para los desarrolladores a través de la plataforma unificada de aprendizaje automático Vertex AI, ofreciendo una amplia gama de herramientas para impulsar la innovación en sus programas.

QQ_1742262673191.png

Chirp3 admite 248 voces diferentes y permite la síntesis de voz en 31 idiomas. Los desarrolladores pueden utilizar este modelo para crear una variedad de aplicaciones, como asistentes de voz inteligentes, audiolibros y doblaje de video. Google afirma que las capacidades de voz de Chirp3 pueden capturar los matices de la entonación humana, haciendo que las conversaciones sean más vívidas y atractivas.

Además de utilizar las voces preexistentes, los usuarios pueden crear voces personalizadas a través de la API de texto a voz de Google Cloud. Sin embargo, para garantizar un uso responsable, Google ha limitado el acceso a esta función de clonación de voz para prevenir posibles abusos y asegurar el cumplimiento de las prácticas de IA ética.

En la presentación, el CEO de Google Cloud, Thomas Kurian, destacó la visión general de Google de ofrecer una amplia gama de modelos, incluyendo, además de Chirp3, productos como Gemini, Imagen y Veil. Google también presentó un nuevo producto llamado Agent Space, diseñado para usuarios comerciales para satisfacer sus necesidades específicas.

El CEO de Google DeepMind, Sir Demis Hassabis, también presentó la evolución de Gemini, especialmente su capacidad de comprensión multimodal. Mencionó que en AI Studio, los usuarios pueden publicar enlaces de YouTube, y Gemini puede procesar el contenido del video, utilizando su ventana de contexto a largo plazo para permitir a los usuarios hacer preguntas y encontrar rápidamente momentos clave en conferencias o eventos deportivos.

Además, Google aprovechó la oportunidad para anunciar un programa destinado a mejorar las habilidades de IA en el Reino Unido a través de un programa de capacitación integral, ayudando a los profesionales a dominar eficazmente la tecnología de IA. Google proporcionará a las startups del Reino Unido créditos para el uso de infraestructura en la nube y herramientas de IA, apoyando su rápido desarrollo y expansión de soluciones innovadoras para estimular el emprendimiento.

En cuanto a la privacidad y el cumplimiento normativo, Google reiteró su compromiso con la residencia de datos, y sus herramientas Vertex AI y Agent Space AI pueden ayudar a las organizaciones a entrenar y prestar servicios de modelos de acuerdo con las leyes locales. Esto es crucial para sectores como la sanidad y las finanzas, que tienen requisitos muy estrictos en materia de privacidad y cumplimiento.

Proyecto: https://cloud.google.com/text-to-speech/docs/chirp3-hd

Puntos clave:

🌟 Google Cloud lanza el modelo de voz Chirp3, que admite 248 voces y 31 idiomas, ayudando a los desarrolladores a crear aplicaciones inteligentes.

🔒 Google limita el acceso a la función de clonación de voz para garantizar las prácticas de IA ética y prevenir el mal uso.

💼 Google lanza un programa para mejorar las habilidades de IA en el Reino Unido y proporciona apoyo de infraestructura en la nube a las startups para fomentar la innovación.