Equipe de IA/ML da Apple e Universidade de Columbia superam o desafio de CAPTCHA do Google

站长之家

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Oct 12, 2023

Modelo Multimodal "Furão" Desafia CAPTCHA do Google

A equipe de IA/ML da Apple, em colaboração com a Universidade de Columbia, desenvolveu um modelo multimodal de grande escala chamado "Furão" (Ferret), que superou com sucesso o CAPTCHA de verificação humana do Google. O Furão consegue reconhecer sinais de trânsito e melhorar a precisão de modelos de grande escala em tarefas de "ver, dizer, responder".

A inovação do Furão reside na sua capacidade de integrar a compreensão espacial de referências e localização, compreendendo simultaneamente o significado e o objetivo, ao contrário dos modelos multimodais tradicionais. Utilizando um método de representação de região híbrida, combinando coordenadas discretas e características contínuas, o modelo apresentou um desempenho excepcional em avaliações multitarefas, especialmente nas tarefas de referência e ancoragem visual (visual grounding).

Essa conquista foi alcançada por uma equipe chinesa, destacando a força da China na pesquisa de modelos multimodais de grande escala e oferecendo uma nova direção para a compreensão de imagens e tarefas multimodais. Os sucessos do Furão prometem avanços significativos em áreas como interação homem-máquina e pesquisa inteligente.

Eficiência de modelos grandes em alta: tecnologia COMET do ByteDance é open-source, acelerando em 1,7 vezes

A equipe do modelo Doubao da ByteDance anunciou recentemente que conseguiu superar os gargalos críticos da arquitetura do modelo de especialista misto (MoE) e lançou uma tecnologia de otimização importante chamada COMET. Essa tecnologia melhora significativamente a eficiência do treinamento de modelos grandes, resultando em um aumento de eficiência de até 1,7 vezes e reduzindo os custos de treinamento em 40%. Nota sobre a imagem: imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney. De acordo com a apresentação, a tecnologia COMET já foi aplicada no treinamento de clusters de dez mil GPUs na ByteDance, economizando milhões de GPUs.

Notícias e Informações de IA

Equipe de IA/ML da Apple e Universidade de Columbia superam o desafio de CAPTCHA do Google

站长之家

Notícias de IA Relacionadas Recomendadas

iFlytek entra na corrida do desenvolvimento de modelos grandes com sucesso graças a placas de computação nacionais

Eficiência de modelos grandes em alta: tecnologia COMET do ByteDance é open-source, acelerando em 1,7 vezes

Arquitetura MLA do DeepSeek: Um novo avanço na migração de modelos grandes

Volcano Engine anuncia código aberto para aplicativos de modelos grandes: Laboratório de aplicativos de modelos grandes lançado para liberar o potencial de inovação da IA