O Google Labs lançou recentemente nos EUA sua mais nova ferramenta experimental de IA generativa, o Whisk. Diferentemente das ferramentas tradicionais de geração de imagens, que dependem principalmente de prompts de texto, o Whisk utiliza imagens como método de entrada principal, permitindo que os usuários criem obras de arte de forma mais intuitiva.

Os usuários podem carregar imagens diretamente para o Whisk ou gerar imagens dentro da ferramenta, especificando elementos como tema, cenário e estilo. O sistema Whisk permite que os usuários misturem e combinem esses componentes e podem usar prompts de texto adicionais para ajustes finos, conforme necessário.

image.png

Vale ressaltar que, nos bastidores, o modelo de linguagem do Google (provavelmente o Gemini 2.0 Flash, lançado recentemente) gera automaticamente uma descrição detalhada da imagem de entrada. Essas descrições são inseridas no modelo de geração de imagens mais recente do Google, o Imagen 3, para capturar as características essenciais do assunto, em vez de criar uma cópia idêntica.

O AIbase realizou vários testes. Ao carregar as três imagens da esquerda, foi possível gerar a imagem combinada à direita. O resultado foi bastante satisfatório e a ferramenta se mostrou muito divertida. Veja abaixo:

8a92dca39c0f78a14c7a360b3fe86803.png

2a4e7ad2d1618ebedcb8151bb9b8b117.png

No entanto, como o Whisk extrai apenas alguns elementos-chave de cada imagem de origem, o Google alerta que o resultado da imagem gerada pode diferir do esperado. Por exemplo, a imagem gerada pode apresentar diferenças em altura, peso, penteado ou tom de pele em comparação com as imagens originais.

Para isso, o Google afirma que esses detalhes são muitas vezes cruciais para o sucesso do projeto, permitindo que os usuários vejam e editem os prompts de texto que impulsionam o processo de geração de imagens.

Testadores iniciais, incluindo alguns artistas e profissionais criativos, disseram que o Whisk se assemelha mais a uma nova ferramenta criativa do que a um editor de imagens tradicional. O Google espera que a ferramenta ajude os usuários a fazerem brainstorming visual rapidamente, em vez de edições precisas, permitindo que eles gerem e filtrem várias opções rapidamente antes de salvarem seus trabalhos favoritos.

Em testes iniciais, embora o Whisk seja muito agradável de usar, a geração de cada nova imagem leva alguns segundos. Esses atrasos podem ser devidos ao alto tráfego, com muitos usuários acessando a nova ferramenta.

Atualmente, o Whisk está disponível apenas para usuários nos EUA, que podem experimentá-lo gratuitamente e compartilhar feedback em labs.google/whisk. Usuários de outros países ainda não têm acesso à ferramenta.

O Whisk faz parte do Google Labs, um ambiente de testes do Google para seus projetos de IA, incluindo Gemini, Imagen e o mais recente modelo de vídeo Veo2. Embora a maioria dos projetos ainda esteja em fase experimental, alguns projetos bem-sucedidos, como o assistente de IA NotebookLM, recentemente lançado oficialmente, são transformados em produtos completos.

Endereço para experimentar o produto: https://top.aibase.com/tool/whisk

Destaques:

🌟 O Google lança o Whisk, a primeira ferramenta de IA generativa baseada em imagens.

🎨 Os usuários podem carregar ou gerar imagens para design visual rápido, em vez de edição precisa.

🚫 Atualmente, apenas para usuários nos EUA, outros países ainda não têm acesso.