Recentemente, a OpenAI revelou discretamente o misterioso projeto "Morango". Anteriormente conhecido como Q*, o projeto, agora renomeado como Morango, supostamente permite que a IA planeje tarefas antecipadamente, busque informações online de forma autônoma e até mesmo conduza pesquisas aprofundadas.

Até mesmo o magnata da tecnologia Elon Musk se intrometeu, comentando com ironia: "Eu pensava que o fim da IA seria o desastre do clipe de papel, mas agora parece que será um campo infinito de morangos."

image.png

Apesar da curiosidade em torno do projeto Morango, a OpenAI mantém detalhes de sua operação em segredo. O desenvolvimento do projeto é altamente confidencial dentro da empresa, a ponto de até mesmo a data de lançamento ser um mistério.

Em uma reunião interna recente, a OpenAI exibiu uma versão de demonstração do projeto Morango, cuja capacidade de raciocínio é quase comparável à de um humano. Isso coincide com o recente roteiro de AGI divulgado pela empresa, levando a especulações sobre possíveis grandes ações da OpenAI.

O conceito de design do modelo Morango é permitir que a IA não apenas gere respostas a consultas, mas também planeje antecipadamente, navegue na internet de forma autônoma e confiável e realize o que é chamado de "pesquisa profunda". Atualmente, essa capacidade é inédita no campo da IA.

Fontes dizem que o projeto Morango da OpenAI é semelhante a um método desenvolvido pela Universidade de Stanford - o "Raciocinador Autodidata" (STaR). O STaR melhora a si mesmo através da criação iterativa de dados de treinamento.

image.png

Endereço do artigo:https://arxiv.org/pdf/2203.14465

Atualmente, os métodos para gerar o processo de raciocínio da IA são ou muito caros ou comprometem a precisão. Mas a tecnologia STaR, usando iterativamente poucos exemplos de raciocínio e muitos dados sem raciocínio, permite que a IA melhore a si mesma.

O fluxo de trabalho da tecnologia STaR é o seguinte: primeiro, a IA tenta responder a muitas perguntas e gera um processo de raciocínio. Se a resposta estiver incorreta, ela gera novamente o raciocínio, sabendo a resposta correta. Em seguida, todos os raciocínios que finalmente chegaram à resposta correta são ajustados finamente, e o processo é repetido.

A OpenAI espera que a inovação do Morango melhore significativamente a capacidade de raciocínio dos modelos de IA. Isso envolve um tratamento especial - após o pré-treinamento do modelo de IA com uma grande quantidade de dados, ele é ajustado para otimizar o desempenho.

A OpenAI também espera que o Morango execute tarefas de longa duração (LHT), o que requer que o modelo planeje e execute uma série de ações antecipadamente. Para atingir esse objetivo, eles estão criando e avaliando um conjunto de dados de "pesquisa profunda".

Com o avanço do projeto Morango, a OpenAI está cada vez mais perto de alcançar seu objetivo de AGI. Se a capacidade de raciocínio do Morango realmente se tornar comparável à de um humano, o futuro da IA será ilimitado.