Investigação sobre a desordem na avaliação de modelos grandes: o tamanho do parâmetro não é tudo

36氪

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Sep 25, 2023

Com o boom do ChatGPT, rankings de avaliação de modelos de linguagem grandes (LLMs) nacionais e internacionais têm sido lançados sucessivamente. No entanto, modelos com tamanhos de parâmetros semelhantes apresentam diferenças significativas de classificação em diferentes rankings. A indústria e o meio acadêmico analisam que isso se deve principalmente às diferenças nos conjuntos de avaliação, e também à crescente proporção de questões subjetivas, o que levanta dúvidas sobre a imparcialidade da avaliação. Portanto, instituições de avaliação de terceiros, como OpenCompass e FlagEval, estão ganhando destaque. No entanto, a indústria acredita que, para realizar uma avaliação de LLM realmente abrangente e eficaz, outros aspectos, como a robustez e a segurança do modelo, também precisam ser considerados, e a pesquisa ainda está em andamento.

Estrutura ScaleOT apresentada na AAAI 2025: Melhora a proteção de privacidade em 50% e reduz o custo computacional em 90%

Recentemente, durante a AAAI 2025, uma conferência acadêmica de ponta em inteligência artificial global, uma equipe conjunta da Ant Group, Universidade de Zhejiang, Universidade de Liverpool e Universidade Normal do Leste da China apresentou uma estrutura inovadora de ajuste remoto (offsite-tuning) — ScaleOT. Essa estrutura consegue melhorar a proteção de privacidade em 50% sem perda de desempenho do modelo. Em comparação com a técnica de destilação de conhecimento, o consumo computacional é reduzido significativamente em 90%, fornecendo uma solução eficiente e leve para o ajuste remoto de modelos com bilhões de parâmetros. O artigo foi selecionado para apresentação oral na AAAI devido à sua inovação.

360 ZhiNao lança Tiny-R1-32B: desempenho quase completo do Deepseek-R1 com apenas 5% dos parâmetros

A equipe 360 ZhiNao, em colaboração com a Universidade de Pequim, lançou oficialmente o modelo de raciocínio de tamanho médio Tiny-R1-32B-Preview. Com apenas 5% dos parâmetros, este modelo se aproxima com sucesso do desempenho completo do Deepseek-R1-671B, demonstrando o enorme potencial de modelos menores na área de inferência eficiente. O desempenho do modelo é particularmente notável em várias áreas-chave. Na área da matemática, o Tiny-R1-32B-Preview...

Lançado o 'Di Ting', primeiro modelo de onda sísmica de bilhões de parâmetros do mundo; abertura total prevista para 2025

Em 17 de janeiro, no Centro Nacional de Supercomputação de Chengdu, ocorreu um avanço tecnológico significativo na área de monitoramento e análise de terremotos. A terceira versão de teste do 'Di Ting', o primeiro modelo de onda sísmica do mundo com bilhões de parâmetros, foi lançada. Desenvolvido em conjunto pelo Centro Nacional de Supercomputação de Chengdu, pelo Instituto de Pesquisa Geofísica da Administração Sismológica da China e pela Universidade Tsinghua, este modelo representa um grande salto na tecnologia de pesquisa de terremotos na China. O objetivo do desenvolvimento do modelo 'Di Ting' é melhorar a precisão de identificação e a capacidade de monitoramento de sinais sísmicos, especialmente em situações...

Meta lança nova tecnologia de camada de memória: ultrapassando limites de parâmetros e melhorando significativamente a precisão de fatos da IA

A Meta anunciou recentemente uma descoberta inovadora: o desenvolvimento de uma nova tecnologia de camada de memória que melhora significativamente a precisão factual dos modelos de linguagem grandes (LLMs) e permite uma expansão sem precedentes na escala de parâmetros. Essa tecnologia não apenas desafia os métodos tradicionais de expansão de redes neurais, mas também fornece novas direções para o design de arquiteturas de IA futuras. O cerne desta pesquisa reside no uso de um mecanismo de pesquisa chave-valor treinável para adicionar parâmetros extras ao modelo sem aumentar a quantidade de cálculos (FLOPs). Este método central se baseia em...

Notícias e Informações de IA

Investigação sobre a desordem na avaliação de modelos grandes: o tamanho do parâmetro não é tudo

36氪

Notícias de IA Relacionadas Recomendadas

Estrutura ScaleOT apresentada na AAAI 2025: Melhora a proteção de privacidade em 50% e reduz o custo computacional em 90%

360 ZhiNao lança Tiny-R1-32B: desempenho quase completo do Deepseek-R1 com apenas 5% dos parâmetros

Lançado o 'Di Ting', primeiro modelo de onda sísmica de bilhões de parâmetros do mundo; abertura total prevista para 2025

Meta lança nova tecnologia de camada de memória: ultrapassando limites de parâmetros e melhorando significativamente a precisão de fatos da IA