Recentemente, a OpenAI divulgou uma notícia interessante: além da já lançada capacidade de geração de vídeo, seu projeto interno Sora também está desenvolvendo ativamente a função de geração de imagens. Este novo recurso permitirá que os usuários alternem rapidamente entre a geração de vídeo e imagem, aumentando a flexibilidade criativa.

De acordo com informações internas, o Sora terá um botão de alternância oculto. Os usuários precisarão apenas selecioná-lo na barra de prompts para mudar entre os dois modos. Ao selecionar a geração de imagem, o sistema solicitará automaticamente ao usuário que descreva uma imagem. Este design visa simplificar a operação do usuário e melhorar a relevância e a qualidade do conteúdo gerado.

image.png

Além da melhoria da função de geração de imagens, o Sora também reclassificou seus vídeos. As novas categorias "Best" e "Top" ajudarão os usuários a filtrar e encontrar conteúdo com mais facilidade. A categoria "Best" é semelhante aos canais em destaque atuais, enquanto a categoria "Top" provavelmente classificará os vídeos com base no número de curtidas ou em um determinado período. Essa mudança na classificação gera expectativa sobre o mecanismo de recomendação de conteúdo do Sora.

image.png

Para os usuários do DALL-E3, essa notícia é sem dúvida empolgante, pois o DALL-E3 parece um pouco desatualizado desde seu lançamento, especialmente em comparação com concorrentes como o Midjourney. Embora a função de geração de imagens do Sora ainda não tenha sido lançada oficialmente, a categoria "Imagens Internas" na barra de navegação lateral já despertou a curiosidade dos usuários. Embora atualmente esta categoria seja usada principalmente para a exibição de vídeos, no futuro ela também poderá oferecer conteúdo relacionado à geração de imagens.

Há especulações de que este novo modelo de geração de imagens possa ser chamado de DALL-E4, mas a OpenAI ainda não confirmou isso. Especialistas do setor especulam que o gerador de imagens do Sora pode não usar diretamente o DALL-E4, mas sim depender do modelo "sora-turbo" existente. Além disso, especialistas também apontam que o ChatGPT ainda não lançou uma função de geração de imagens multimodais baseada no GPT-4, portanto, o lançamento do projeto Sora será um novo desenvolvimento digno de nota.

Vale ressaltar que o gerador de imagem a partir de texto no Sora é chamado de "papaya", o que aumenta a curiosidade e a expectativa em torno do projeto. Um ano e meio após o lançamento do DALL-E3, a expectativa é grande para ver quais inovações o próximo modelo trará.