Nos últimos anos, tem havido muita discussão sobre se o mercado de computadores e telefones celulares está em declínio. Recentemente, a Micron, fabricante de chips de memória, reduziu suas previsões de receita para os próximos trimestres devido às vendas abaixo do esperado de computadores com IA e smartphones, o que gerou preocupações de que a "IA esteja morrendo". No entanto, na realidade, a IA não mostra sinais de declínio, como demonstram os resultados da Nvidia.
Observação da fonte: Imagem gerada por IA, fornecida pela Midjourney.
Atualmente, muitos laptops e telefones celulares que alegam ter recursos de IA não possuem capacidade de processamento suficiente. Mesmo PCs de jogos de alto desempenho têm dificuldade em executar localmente aplicativos de IA complexos, como o ChatGPT, pois esses aplicativos exigem enormes quantidades de dados e poder computacional que não podem ser facilmente atendidos por um computador pessoal. Embora existam aplicativos alternativos disponíveis, eles são significativamente inferiores em desempenho e velocidade de resposta em comparação com a maioria dos aplicativos de IA executados em servidores.
No ecossistema de IA, as empresas e ferramentas de alto desempenho já estão bem estabelecidas. Por exemplo, usuários com placas de vídeo Nvidia RTX geralmente superam muitos CPUs modernos com NPU em termos de desempenho de IA. Comparativamente, um RTX4080 supera um laptop com Intel Core Ultra9185H em cargas de trabalho de IA em 700% a 800%. Isso destaca o papel crucial dos servidores na entrega de desempenho de IA.
O Google expandiu seu modelo de IA Gemini para a maioria dos dispositivos Android e planeja integrá-lo aos alto-falantes Nest. Embora esses dispositivos existam há quatro anos, eles demonstram a ampla aplicabilidade da tecnologia de IA. No passado, acreditava-se que o desempenho da placa gráfica precisava atingir petaflops (PFLOPs) para uma verdadeira experiência de realidade virtual, e as placas gráficas atuais ainda não atingiram esse padrão, refletindo os desafios contínuos do desenvolvimento de IA local.
No desenvolvimento de fabricantes de GPUs, a programação de IA geralmente depende de computação paralela, na qual as GPUs se destacam. Portanto, o design futuro de GPUs ainda levará tempo, possivelmente até o lançamento da série RTX 60, para ver melhorias significativas no desempenho da IA. Essa geração de placas gráficas pode tornar possível a execução de grandes modelos de linguagem (LLMs) localmente.
Destaques:
🌟 A tecnologia de IA não está morta; o desempenho do mercado é influenciado por mal-entendidos.
💻 Muitos dispositivos que se anunciam como IA dependem de servidores para desempenho e têm dificuldade em realizar cálculos complexos localmente.
🚀 Os avanços futuros na tecnologia de GPU podem impulsionar o desenvolvimento de modelos de IA locais.