OSI publica novo padrão de IA de código aberto: dados de treinamento devem ser divulgados, o Llama do Meta é falso código aberto?

AIbase基地

Publicado emNotícias e Informações de IA · 6 minutos de leitura · Oct 29, 2024

124

Recentemente, a Open Source Initiative (OSI) lançou uma nova definição que esclarece o que realmente constitui inteligência artificial (IA) de código aberto. Este novo padrão chamou a atenção de gigantes da tecnologia, especialmente o modelo Llama do Meta, pois não atende a essas regras. A OSI sempre foi a definidora de padrões para software de código aberto, mas em sistemas de IA existem elementos não cobertos por licenças tradicionais, como os dados de treinamento do modelo.

De acordo com a nova definição da OSI, qualquer sistema de IA considerado verdadeiramente de código aberto deve fornecer três coisas: primeiro, detalhes completos sobre os dados usados para treinar a IA, para que outros possam entender e reproduzir os resultados; segundo, o código completo usado para construir e executar a IA; e terceiro, as configurações e pesos de treinamento que influenciam os resultados da IA.

Modelo grande, código, internet

Observação da fonte: Imagem gerada por IA, fornecida pelo Midjourney.

Essa regra desafia diretamente o modelo Llama do Meta. Embora o Llama possa ser baixado e usado publicamente, ele tem restrições para uso comercial e não fornece os dados de treinamento, portanto, não atende aos padrões abertos da OSI. A porta-voz do Meta, Faith Eischen, disse que eles concordam com a OSI em muitos aspectos, mas discordam dessa definição. Ela apontou que definir "IA de código aberto" não é fácil, pois as definições tradicionais não abrangem a complexidade dos modelos de IA em rápida evolução de hoje.

O diretor executivo da OSI, Stefano Maffulli, disse que eles levaram dois anos para desenvolver esse padrão com especialistas globais. Eles se envolveram em discussões aprofundadas com acadêmicos, especialistas em aprendizado de máquina e processamento de linguagem natural, e também com criadores de conteúdo, buscando abrangência.

A justificativa do Meta para restringir o acesso aos dados de treinamento é principalmente por motivos de segurança, mas os críticos argumentam que por trás disso pode haver uma tentativa de reduzir a responsabilidade legal e proteger a vantagem competitiva. Muitos modelos de IA quase certamente contêm materiais protegidos por direitos autorais em seus dados de treinamento. Atualmente, ações judiciais contra o Meta, OpenAI e outras empresas estão surgindo, e os autores só podem recorrer a evidências indiretas para provar que suas obras foram usadas.

Ao mesmo tempo, Maffulli acredita que a situação atual é semelhante ao passado. Ele lembra da atitude da Microsoft em relação ao código aberto na década de 1990 e acredita que o Meta está bloqueando sua tecnologia com justificativas semelhantes. Para eles, os dados de treinamento são a "arma secreta".

Destaques:
🌐 A nova definição da OSI exige que os sistemas de IA forneçam dados de treinamento, código e configurações, impulsionando a padronização da "IA aberta".
🦙 O modelo Llama do Meta não atende aos padrões de código aberto por não fornecer dados de treinamento, enfrentando questionamentos do setor.
⚖️ Aumento de disputas judiciais: o Meta e outras empresas de IA estão sendo processadas por usar materiais protegidos por direitos autorais, gerando preocupação com a responsabilidade legal.

Executivos do Google respondem à reversão do compromisso com IA de armas e metas de diversidade, causando indignação entre funcionários!

Em uma recente reunião de todos os funcionários, executivos do Google detalharam a decisão da empresa de abandonar as metas de diversidade e inclusão (D&I) e seu compromisso de não desenvolver inteligência artificial para fins bélicos. Melonie Parker, ex-chefe de diversidade do Google, afirmou que a empresa interromperá os programas de treinamento de D&I para funcionários e “atualizará” outros treinamentos relacionados. Esta é a primeira resposta a todos os funcionários desde que o Google anunciou que não estabeleceria mais metas de contratação para diversidade. O advogado-chefe do Google, Kent Walker, disse que, desde que a empresa apresentou pela primeira vez sua AI Princ

Estudo alerta para os limites dos modelos de linguagem de IA: desempenho reduzido à metade com contexto superior a 8K, raciocínio conceitual se torna um desafio

Uma pesquisa recente realizada pela Universidade de Munique, o Centro de Aprendizado de Máquina de Munique e a Adobe Research mostra que 12 modelos de linguagem de IA de ponta, incluindo GPT-4o, Gemini1.5Pro e Llama-3.3-70B, enfrentam uma redução significativa de desempenho em tarefas de raciocínio conceitual com texto longo. Embora esses modelos suportem o processamento de contexto de pelo menos 128.000 tokens, sua capacidade de ligação lógica profunda ainda apresenta limitações fundamentais. A equipe de pesquisa desenvolveu o NOLIMA (sem correspondência de texto)

Usuários ativos mensais de aplicativos AIGC ultrapassam 100 milhões, com Doubao dominando metade do mercado

De acordo com os dados mais recentes da empresa de pesquisa QuestMobile, até o final de novembro de 2024, os usuários ativos mensais de aplicativos AIGC (conteúdo gerado por inteligência artificial) na China ultrapassaram 100 milhões. Entre eles, o Doubao, da ByteDance, se destacou, detendo metade do mercado graças à sua sólida base de usuários. Simultaneamente, o Wen Xiaoyan do Baidu e o Kimi, assistente inteligente desenvolvido pela Yue Zhi Anmian, também conquistaram espaço no mercado. Com o rápido crescimento dos aplicativos AIGC, a concentração de usuários em empresas líderes tende a aumentar.

Notícias e Informações de IA

OSI publica novo padrão de IA de código aberto: dados de treinamento devem ser divulgados, o Llama do Meta é falso código aberto?

AIbase基地

Notícias de IA Relacionadas Recomendadas

Cuidado com riscos de segurança! Ferramenta de modelo grande Ollama apresenta vulnerabilidades graves

Executivos do Google respondem à reversão do compromisso com IA de armas e metas de diversidade, causando indignação entre funcionários!

Estudo alerta para os limites dos modelos de linguagem de IA: desempenho reduzido à metade com contexto superior a 8K, raciocínio conceitual se torna um desafio

Usuários ativos mensais de aplicativos AIGC ultrapassam 100 milhões, com Doubao dominando metade do mercado