O Google Cloud realizou um evento na sede do DeepMind, em Londres, para lançar oficialmente seu modelo de linguagem de alta definição, o Chirp3. O modelo está disponível para desenvolvedores por meio da plataforma unificada de aprendizado de máquina Vertex AI, oferecendo uma ampla gama de ferramentas de desenvolvimento para impulsionar a inovação em aplicativos.
O Chirp3 suporta 248 vozes diferentes e pode sintetizar fala em 31 idiomas. Os desenvolvedores podem usar este modelo para criar uma variedade de aplicativos, como assistentes de voz inteligentes, audiolivros e dublagem de vídeo. O Google afirma que a capacidade de voz do Chirp3 consegue capturar as nuances da entonação humana, tornando as conversas mais vívidas e envolventes.
Além de usar vozes prontas, os usuários também podem criar vozes personalizadas por meio da API de texto para fala do Google Cloud. No entanto, para garantir o uso responsável, o Google limitou o acesso ao recurso de clonagem de voz para evitar potenciais abusos e garantir práticas de IA ética.
Na apresentação, o CEO do Google Cloud, Thomas Kurian, enfatizou a visão geral do Google de fornecer uma ampla gama de modelos, incluindo, além do Chirp3, produtos como Gemini, Imagen e Veil. O Google também lançou um novo produto chamado Agent Space, projetado para atender às necessidades específicas de usuários comerciais.
O CEO do Google DeepMind, Sir Demis Hassabis, também apresentou a evolução do Gemini, especialmente sua capacidade de compreensão multimodal. Ele mencionou que, no AI Studio, os usuários podem postar links do YouTube e o Gemini pode processar o conteúdo do vídeo, usando sua janela de contexto longo para permitir que os usuários façam perguntas e encontrem rapidamente momentos-chave de palestras ou eventos esportivos.
Além disso, o Google aproveitou a oportunidade para anunciar um programa para melhorar as habilidades de IA no Reino Unido por meio de treinamento abrangente, ajudando profissionais a dominar efetivamente a tecnologia de IA. O Google fornecerá créditos de uso de infraestrutura em nuvem e ferramentas de IA para startups britânicas, apoiando-as no desenvolvimento e expansão rápidos de soluções inovadoras para estimular o empreendedorismo.
Em termos de privacidade e conformidade, o Google reiterou seu compromisso com a residência de dados, e suas ferramentas de IA Vertex AI e Agent Space podem ajudar as organizações a treinar e fornecer modelos em conformidade com as leis locais. Isso é crucial para setores como saúde e finanças, que têm requisitos rigorosos de privacidade e conformidade.
Projeto: https://cloud.google.com/text-to-speech/docs/chirp3-hd
Destaques:
🌟 O Google Cloud lança o modelo de voz Chirp3, com suporte a 248 vozes e 31 idiomas, ajudando os desenvolvedores a construir aplicativos inteligentes.
🔒 O Google limita o acesso ao recurso de clonagem de voz para garantir práticas éticas de IA e evitar abusos.
💼 O Google lança um programa para melhorar as habilidades de IA no Reino Unido e fornecerá suporte de infraestrutura em nuvem para startups, promovendo a inovação.