Google Gemini Exp 1114 Lançado! Suplantando o GPT-4 em seu Primeiro Teste, Alcança o Topo em Várias Avaliações de Capacidades, Causando Impacto na Indústria

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Nov 15, 2024

621

A versão experimental (Exp1114) do Gemini, da Google DeepMind, alcançou resultados impressionantes na plataforma Chatbot Arena. Após mais de uma semana de testes na comunidade, com mais de 6.000 votos, o novo modelo superou significativamente seus concorrentes, demonstrando força em várias áreas-chave.

Na pontuação geral, o Gemini-Exp-1114 empatou em primeiro lugar com o GPT-4-latest, com uma excelente pontuação acima de 40 pontos, superando a versão anterior, GPT-4-preview. Ainda mais surpreendente, o modelo alcançou o primeiro lugar em áreas essenciais como matemática, prompts complexos e escrita criativa, demonstrando uma força abrangente.

Especificamente, o progresso do Gemini-Exp-1114 é impressionante:

Saltou do 3º para o 1º lugar na classificação geral.

Subiu do 3º para o 1º lugar na avaliação de habilidades matemáticas.

Ascendeu do 4º para o 1º lugar no processamento de prompts complexos.

Melhorou do 2º para o 1º lugar na escrita criativa.

Também ocupa o primeiro lugar no processamento visual.

E melhorou sua capacidade de programação do 5º para o 3º lugar.

O Google AI Studio já lançou oficialmente essa nova versão para os usuários experimentarem. No entanto, a comunidade também expressou preocupações sobre alguns problemas específicos, como a persistência do limite de 1000 tokens e como lidar com a saída de textos muito longos em aplicações reais.

Analistas do setor acreditam que esse avanço demonstra que os investimentos de longo prazo do Google em IA estão começando a dar frutos. Curiosamente, o modelo manteve a 4ª posição em controle de estilo, o que pode sugerir que a equipe de desenvolvimento utilizou principalmente novos métodos de pós-treinamento, em vez de modificar o modelo pré-treinado.

Essa grande conquista também gerou discussões sobre a configuração do setor. A OpenAI costumava lançar novos produtos quando os concorrentes publicavam atualizações importantes, mas a magnitude do progresso do Google desta vez chamou a atenção do setor. Alguns acreditam que isso pode prenunciar a chegada do Gemini 2, e que a competitividade do Google na área de modelos grandes está aumentando significativamente.

OpenAI Lança o GPT-4O-Audio-Preview: Áudio que 'Entende' Emoções!

A OpenAI lidera novamente a inovação em inteligência artificial com o lançamento do novo modelo gpt-4o-audio-preview. Este modelo demonstra capacidades surpreendentes na geração e análise de áudio, abrindo novas possibilidades para a interação humano-computador. Vamos explorar os recursos deste modelo inovador e suas potenciais aplicações. As principais funcionalidades do gpt-4o-audio-preview incluem três aspectos: primeiro, ele pode gerar respostas de voz naturais e fluidas com base em texto, fornecendo suporte para aplicativos como assistentes de voz e atendimento virtual.

AI torna o vento 'visível' na America's Cup

Na 37ª America's Cup, o programa WindSightIQ estreou na transmissão televisiva, utilizando LiDAR, fusão de sensores e computação científica para visualizar o campo de vento como gráficos de realidade aumentada e virtual. Isso ajuda os espectadores a entenderem os fatores de vento cruciais na navegação. Embora os velejadores ainda confiem na intuição e no treinamento para planejar suas rotas, comentaristas e espectadores agora podem ver em tempo real os padrões de vento, comparar o desempenho real com a rota ideal, participando da regata em um nível sem precedentes. Esta inovação oferece uma experiência de visualização totalmente nova, tornando o vento — normalmente invisível — compreensível e envolvente.

Novo modelo OpenAI gpt-4o-2024-08-06 e gpt-4o-mini com suporte a saída estruturada

A OpenAI adicionou a funcionalidade de saída estruturada à sua API, garantindo que a saída gerada esteja totalmente em conformidade com o esquema JSON predefinido, melhorando significativamente a confiabilidade da API e a precisão dos aplicativos. Este recurso não apenas define a estrutura do JSON, mas também garante a precisão da saída. Simultaneamente, houve uma redução de preços, com o custo de entrada reduzido pela metade e o custo de saída reduzido em 1/3. A introdução da saída estruturada resolveu as limitações do esquema JSON em garantir que a saída esteja em conformidade com uma estrutura específica, melhorando significativamente o desempenho do modelo em relação à saída estruturada. Através de inovações tecnológicas, como restrições...

OpenAI lança novo modelo gpt-4o-64k-output-alpha: GPT-4o API agora suporta até 64K de saída

O principal destaque do novo modelo gpt-4o-64k-output-alpha da OpenAI é a capacidade de gerar uma saída de até 64K tokens de uma só vez, ideal para produzir conteúdo rico e detalhado, atendendo às necessidades de redação, programação e análise de dados complexos. No entanto, este recurso aumenta o preço da API, custando US$ 18 por milhão de tokens de saída, em comparação com US$ 6 por milhão de tokens de entrada. Essa medida visa equilibrar os altos custos computacionais e incentivar o uso responsável desta poderosa ferramenta. O modelo é uma ferramenta valiosa para os campos da criação e da pesquisa.