OpenAI revela processo de raciocínio do o3-mini em resposta ao desafio da DeepSeek

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Feb 8, 2025

128

A OpenAI anunciou recentemente a demonstração detalhada do processo de raciocínio de seu mais recente modelo de raciocínio, o o3-mini. Essa ação é vista como uma resposta à crescente pressão de seu concorrente, o DeepSeek-R1.

Anteriormente, a OpenAI mantinha o "Chain of Thought" (CoT) como uma vantagem competitiva central, optando por mantê-lo oculto. No entanto, com modelos abertos como o DeepSeek-R1 exibindo completamente suas trajetórias de raciocínio, essa estratégia fechada tornou-se uma desvantagem para a OpenAI. Embora o novo o3-mini ainda não revele completamente as marcações originais, ele oferece uma demonstração mais clara do processo de raciocínio.

Em termos de desempenho e custo, a OpenAI também está buscando se aproximar. O preço do o3-mini foi reduzido para US$ 4,40 por milhão de tokens de saída, muito abaixo dos US$ 60 do modelo o1 anterior, aproximando-se da faixa de US$ 7-8 do DeepSeek-R1 em provedores americanos. Ao mesmo tempo, o o3-mini superou seus antecessores em vários testes de referência de raciocínio.

Testes práticos mostram que a demonstração detalhada do processo de raciocínio do o3-mini realmente melhorou a utilidade do modelo. Ao lidar com dados não estruturados, os usuários conseguem entender melhor a lógica de raciocínio do modelo, permitindo otimizar as instruções para obter resultados mais precisos.

O CEO da OpenAI, Sam Altman, recentemente admitiu ter "estado do lado errado da história" no debate sobre código aberto. Com a adoção e melhoria do DeepSeek-R1 por diversas instituições, os ajustes futuros da OpenAI em sua estratégia de código aberto merecem atenção.

iFlytek anuncia atualização completa do modelo de raciocínio profundo StarFire X1

A iFlytek anunciou uma atualização completa para seu modelo de raciocínio profundo, o StarFire X1. Esta atualização visa melhorar suas capacidades de aplicação em várias áreas, como matemática, medicina e educação, trazendo uma série de destaques e inovações. A capacidade matemática do StarFire X1 foi significativamente aprimorada, especialmente no que diz respeito ao tratamento de problemas de nível de competição. Em comparação com outros modelos do setor, o StarFire X1, mesmo com uma quantidade menor de parâmetros de modelo, ainda se compara aos modelos DeepSeek R1 e OpenAI em tarefas matemáticas. Os usuários podem acessar o StarFire da iFlytek através de...

Quora Poe lança recurso de aplicativos de IA personalizados, permitindo que os usuários criem aplicativos personalizados com facilidade

O Quora lançou recentemente um novo recurso em sua plataforma de IA Poe que permite aos usuários construir aplicativos de IA personalizados. Chamado de "Poe Apps", este recurso permite que os usuários criem interfaces visuais na plataforma Poe através de uma simples descrição. Os usuários podem escolher diferentes modelos de IA para realizar suas ideias de aplicativos. Na nova ferramenta de criação de aplicativos, os usuários precisam apenas descrever o aplicativo que desejam criar, incluindo a especificação do modelo de IA a ser usado, como o da OpenAI.

A ferramenta de programação AI Cursor agora integra o modelo de raciocínio Claude 3.7 Sonnet

Em 25 de fevereiro, a Anthropic lançou oficialmente seu mais recente modelo de raciocínio - Claude 3.7 Sonnet. Este modelo, com seu design inovador e capacidades de programação significativamente aprimoradas, rapidamente se tornou um foco da indústria. A inovação central do Claude 3.7 Sonnet reside em sua capacidade de combinar respostas rápidas com raciocínio profundo, simulando o processo de pensamento do cérebro humano para fornecer aos usuários uma experiência de interação mais fluida.

Anthropic lança o modelo de raciocínio híbrido Claude 3.7 Sonnet: capacidades superiores ao DeepSeek

Hoje, a empresa de inteligência artificial Anthropic anunciou o lançamento oficial de seu mais recente "modelo de raciocínio híbrido" - Claude 3.7 Sonnet. Este modelo é elogiado pela Anthropic como o modelo de IA "mais inteligente" de todos os tempos, projetado para resolver problemas mais complexos e demonstrar desempenho superior em áreas como matemática e codificação.