Recentemente, o Google anunciou uma série de novos recursos e produtos no Google I/O, gerando grande expectativa. Embora a maioria ainda não tenha sido lançada, já podemos ter um vislumbre do desenvolvimento em andamento. O Google planeja lançar cinco produtos Gemini em 15 e 18 de julho. Vamos explorar!

image.png

De acordo com engenharia reversa de código frontend e vazamentos de informações, os produtos Gemini a serem lançados podem incluir: a nova versão Imagen3, o Gemini GPT personalizado, recurso de resposta personalizada, recurso de prompt agendado, integração de gravação e Google Fotos. Além disso, há desenvolvimentos em relação a recursos de aprimoramento instantâneo e a extensão do Gemini para o Chrome.

Imagen3

Espera-se que o Imagen3 seja disponibilizado para testadores alfa do AI Labs, e eventualmente para usuários do Gemini Advanced. Embora seja improvável seu lançamento na próxima semana, considerando a qualidade do Imagen2 e a falta de recursos de geração de imagens na União Europeia, esta é uma versão muito aguardada. Há rumores de que os primeiros convites serão enviados para membros do Discord do AI Labs e usuários com assinatura premium.

GEMs

O GPT personalizado do Gemini, chamado GEM (anteriormente conhecido como "Bot"), está em desenvolvimento desde antes do anúncio do I/O. Os usuários poderão visualizar, editar e copiar GEMs, operações acessíveis através da guia GEMs Manager. Dada sua longa duração de desenvolvimento, os GEMs podem ser uma versão importante, mas também podem sofrer atrasos.

image.png

Memória/Recurso de Resposta Personalizada

Este recurso é exibido como uma seção separada no menu lateral, atrás do ícone de resposta do Gemini. A dica de ferramenta indica que este botão permitirá que os usuários programem prompts. Em uma guia dedicada, os usuários podem ver uma lista de tarefas programadas. Este recurso exclusivo permite que os usuários peçam ao Gemini para enviar notícias diárias todas as manhãs, funcionando muito bem em conjunto com o GEM.

image.png

Prompts Predefinidos

Este recurso existe no código há algum tempo e espera-se que sua funcionalidade seja semelhante à função de memória do ChatGPT. Os usuários terão uma opção dedicada nas configurações para acessar a seção personalizada. No entanto, como esta seção é chamada de "Resposta Personalizada", pode haver alguns ajustes.

image.png

Integração de Gravação e Google Fotos

A opção de anexos indica dois novos recursos:

  • Gravação de voz: permite que os usuários gravem mensagens e as enviem como arquivos .wav. Embora a função de gravação pareça viável, parece estar longe do lançamento.
  • Integração do Google Fotos: parece estar quase concluída, permitindo que os usuários selecionem fotos diretamente do aplicativo Fotos na web. No entanto, ainda não resolve o problema de não conseguir carregar várias imagens de uma vez.

image.png

Recursos Aprimorados de Prompts Instantâneos

Um novo botão oculto pode funcionar como um aprimoramento de prompt, de acordo com sua aparência e nome.

image.png

Além disso, recursos adicionais do Gemini para Android foram descobertos anteriormente, e o Google também está recrutando testadores beta para o aplicativo Google para iOS, sugerindo que uma atualização do Gemini para iOS pode estar próxima. Além disso, atualizações futuras podem incluir a capacidade de desativar respostas em tempo real.

image.png

O Gemini, como o modelo de inteligência artificial mais recente e avançado do Google, representa um grande salto na capacidade de IA, e suas funções e cenários de aplicação estão em constante expansão.

Destaques:

🔍 O Google Gemini está prestes a lançar novos recursos, incluindo Imagen3, Gemini GPT personalizado, etc.

🔍 Espera-se que o Gemini também lance recursos de resposta personalizada, prompts agendados, gravação e integração do Google Fotos.

🔍 O Google está intensificando o recrutamento de testadores beta do Gemini para iOS, e a atualização do iOS pode estar próxima.