O Google anunciou recentemente uma atualização do assistente Gemini no Android Studio, adicionando suporte para entrada multimodais. Os desenvolvedores agora podem anexar imagens às suas solicitações para obter assistência visual durante o processo de desenvolvimento de aplicativos.

QQ20250314-144401.png

Apresentado inicialmente na conferência I/O 2024, o Gemini atualizado agora consegue "compreender wireframes simples e convertê-los em código Jetpack Compose utilizável". Na versão Canary do Android Studio Narwal, o campo "Ask Gemini" inclui uma nova opção "Anexar arquivo de imagem" (suporta formatos JPEG ou PNG). O Google recomenda o uso de imagens com "forte contraste de cores" e fornecer "solicitações claras" para melhores resultados.

Os desenvolvedores podem enviar vários tipos de capturas de tela e interfaces de usuário, desde wireframes simples até modelos de alta fidelidade, e especificar a funcionalidade desejada. Por exemplo, em um exemplo de design de calculadora, pode-se solicitar "fazer com que a interação e os cálculos funcionem conforme o esperado".

QQ20250314-144410.png

Solicitações típicas para transformar designs visuais em código de IU funcional incluem: 1. "Para a imagem fornecida, escreva código Android Jetpack Compose para criar uma tela o mais próxima possível desta imagem. Certifique-se de incluir importações, usar Material3 e documentar o código." 2. "Para a imagem fornecida, escreva código Android Jetpack Compose para criar uma tela o mais próxima possível desta imagem, sendo criativo com as cores. Faça com que a interação e os cálculos funcionem conforme o esperado. Certifique-se de incluir importações, usar Material3 e documentar o código."

QQ20250314-144418.png

O Google posiciona o Gemini como uma ferramenta para fornecer "um framework de design inicial", e o código gerado geralmente requer edição e ajustes adicionais. Melhorias comuns incluem garantir a importação correta de objetos e ícones desenhados. O Google recomenda considerar o código gerado como um ponto de partida eficiente para acelerar o fluxo de trabalho de desenvolvimento da IU.

Além disso, a funcionalidade de análise visual do Gemini pode ser usada para identificar e resolver erros. Os desenvolvedores podem "enviar uma captura de tela da IU problemática, e o Gemini analisará a imagem e sugerirá soluções potenciais". Os desenvolvedores também podem anexar trechos de código relevantes para obter ajuda mais precisa.

O Gemini no Android Studio também suporta o envio de diagramas de arquitetura para obter explicações ou documentação, semelhante à funcionalidade dos óculos Gemini Astra apresentada anteriormente na conferência I/O.