A Ascensão dos Modelos de Raciocínio Profundo! Together AI arrecada US$ 305 milhões, impulsionando a demanda por GPUs

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Feb 21, 2025

Na indústria de IA, a Together AI recentemente anunciou o fechamento de uma rodada de financiamento Série B de US$ 305 milhões, notícia que gerou grande atenção. A ascensão da empresa está intimamente relacionada ao seu novo modelo de raciocínio profundo, o DeepSeek-R1. Contrariamente aos temores iniciais, muitos especialistas do setor acreditam que o avanço no raciocínio profundo não diminuiu, mas sim aumentou a demanda por infraestrutura.

Chip GPU (2)

Observação da fonte: Imagem gerada por IA, fornecida pela Midjourney.

Desde sua fundação em 2023, a Together AI tem como objetivo simplificar o uso de modelos de linguagem grandes (LLMs) de código aberto pelas empresas. Com o tempo, a empresa expandiu gradualmente sua plataforma, oferecendo uma solução chamada "Plataforma Together", que suporta a implantação de IA em nuvens privadas virtuais e ambientes locais. Em 2025, a Together AI lançou ainda clusters de inferência e capacidades de IA Agentic, aprimorando ainda mais os recursos de sua plataforma.

Segundo o CEO da Together AI, Vipul Prakash, o DeepSeek-R1 possui 671 bilhões de parâmetros, o que torna o custo de sua execução de inferência considerável. Para atender à crescente demanda dos usuários, a Together AI lançou o serviço "Clusters de Inferência", oferecendo aos clientes capacidade de computação dedicada de 128 a 2000 chips para garantir o melhor desempenho do modelo. Além disso, o tempo de processamento de solicitações do DeepSeek-R1 costuma ser longo, com média de dois a três minutos, o que também contribui para o aumento da demanda por infraestrutura.

Em relação à aplicação de modelos de inferência, a Together AI observou alguns cenários de uso específicos, como agentes de codificação, redução de alucinações do modelo e autoaperfeiçoamento do modelo por meio de aprendizado por reforço. Esses aplicativos não apenas melhoram a eficiência do trabalho, mas também a precisão da saída do modelo.

Além disso, a Together AI adquiriu a CodeSandbox para fortalecer suas capacidades em fluxos de trabalho de IA autônoma. Essa aquisição permite a execução rápida de código na nuvem, reduzindo a latência e melhorando o desempenho do fluxo de trabalho do agente.

Diante da intensa concorrência de mercado, a plataforma de infraestrutura da Together AI está em constante otimização. A implantação de chips Nvidia Blackwell de nova geração proporcionará maior desempenho e menor latência para treinamento e inferência de modelos. Prakash destaca que, em comparação com outras plataformas como o Azure, a velocidade de inferência da Together AI é significativamente maior, atendendo plenamente à demanda dos clientes por infraestrutura de IA de alto desempenho.

Destaques:
🌟 A Together AI recebeu US$ 305 milhões em financiamento, impulsionando o desenvolvimento de modelos de raciocínio profundo.
📈 A complexidade do DeepSeek-R1 aumentou significativamente a demanda por infraestrutura, levando ao lançamento do serviço "Clusters de Inferência" para atender às necessidades do mercado.
🚀 A recém-adquirida CodeSandbox e os chips Nvidia Blackwell aumentarão ainda mais a competitividade da Together AI no mercado.

TogetherAI DeepSeek-R1 Modelos de Linguagem Grandes Nuvem Privada Virtual

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

ByteDance lança QuaDMix: Uma estrutura unificada para qualidade e diversidade de dados de pré-treinamento de modelos de linguagem grandes

Apr 28, 2025

Transformação acelerada da tecnologia bancária: modelos de linguagem grandes aplicados a negócios centrais

Com os desafios e pressões crescentes que o setor bancário enfrenta em sua transformação digital, cada vez mais bancos estão integrando a tecnologia de modelos de linguagem grandes em seus negócios centrais, indo além de simples aplicativos de chatbot. Dados recentes de relatórios financeiros mostram que alguns dos principais bancos domésticos fizeram progressos significativos em investimentos em tecnologia e na aplicação de modelos de linguagem grandes, mas também revelam uma tendência de diferenciação de investimentos. De acordo com uma análise do aplicativo de mídia de titânio de dez bancos principais, incluindo os seis grandes bancos estatais e alguns bancos comerciais, seis deles tiveram uma redução nos investimentos em tecnologia. Por exemplo,

Apr 18, 2025

Tencent cria aplicativos de IA empresarial prontos para uso

A Conferência Global de Ecossistema Digital da Tencent de 2025 foi inaugurada em Chengdu, e a Tencent anunciou seu mais novo aplicativo de IA empresarial: o Mecanismo de Conhecimento de Modelos de Linguagem Grandes da Tencent Cloud. Esta ferramenta inovadora visa fornecer a empresas de todos os tipos capacidades atômicas e modelos de desenvolvimento de aplicativos mais flexíveis, ajudando-as a construir seus próprios sistemas de gerenciamento de conhecimento. O Mecanismo de Conhecimento de Modelos de Linguagem Grandes da Tencent Cloud já foi implantado com sucesso em vários setores, incluindo finanças, energia, transporte, varejo, saúde, governo, educação e turismo. Por meio desta plataforma, muitas empresas, como a Sichuan Wen...

Apr 18, 2025

Laboratório de IA de Xangai lança modelos de linguagem grandes multimodais InternVL3 de código aberto

O OpenGVLab lançou os modelos InternVL3, marcando um novo marco na área de modelos de linguagem grandes multimodais (MLLM). A série InternVL3 inclui 7 modelos de diferentes tamanhos, de 1B a 78B parâmetros, capazes de processar simultaneamente texto, imagens e vídeos, demonstrando um desempenho geral excepcional.

Apr 14, 2025

PaddlePaddle 3.0 Lançado oficialmente: Suporte para modelos de linguagem grandes como o Wenxin 4.5 e redução de 80% nos custos de adaptação entre chips

O PaddlePaddle, plataforma de aprendizado profundo da Baidu, anunciou recentemente o lançamento oficial de sua nova geração de framework, o PaddlePaddle 3.0. Este lançamento introduz cinco inovações tecnológicas principais, incluindo o "Paralelismo Automático Unificado Estático e Dinâmico", visando reduzir efetivamente os custos de desenvolvimento e treinamento de modelos de linguagem grandes e impulsionar a construção de infraestrutura para a era dos modelos de linguagem grandes. Como infraestrutura fundamental para tarefas de treinamento e inferência de modelos de linguagem grandes, o framework PaddlePaddle 3.0 apresenta excelente desempenho em otimização. O framework já suporta vários modelos de linguagem grandes, incluindo Wenxin 4.5 e Wenxin X1, e através de otimizações...

Apr 2, 2025

Pesquisadores de IA da Nvidia lançam técnica de fusão FFN: Acelera a inferência de modelos de linguagem grandes

Mar 31, 2025

180

AMD lança projeto open source GAIA para execução eficiente de modelos de linguagem grandes locais

Recentemente, a AMD anunciou o lançamento de um aplicativo open source chamado GAIA, projetado para fornecer aos usuários uma maneira eficiente e local de executar modelos de linguagem grandes (LLM). Atualmente, o aplicativo é compatível com a plataforma Windows e foi otimizado especificamente para processadores da série Ryzen AI 300, aproveitando ao máximo as vantagens desses processadores em tarefas de IA. O GAIA é um aplicativo de IA generativo que permite aos usuários executar LLMs em seus computadores pessoais de forma privada, garantindo a privacidade dos dados. Além disso, o GAIA utiliza...

Mar 24, 2025

Equipe da CMU apresenta Meta Reinforcement Fine-Tuning (MRT): um novo paradigma para aprimorar o raciocínio de modelos de linguagem grandes

No campo da inteligência artificial, os modelos de linguagem grandes (LLM) estão em constante evolução. Recentemente, pesquisadores da Universidade Carnegie Mellon (CMU) e HuggingFace apresentaram um novo método chamado "Meta Reinforcement Fine-Tuning" (MRT). Este método visa otimizar a eficiência computacional dos modelos de linguagem grandes durante o teste, especialmente ao resolver problemas complexos de raciocínio, mostrando resultados excepcionais. Estudos demonstram que os modelos de linguagem grandes existentes apresentam dificuldades no processo de raciocínio...

Mar 13, 2025

xAI Grok-3 supera o GPT4.5 e conquista o topo da arena de modelos de linguagem grandes

A xAI anunciou recentemente uma notícia emocionante: seu mais recente modelo de IA, Grok-3, obteve um desempenho excepcional no ranking do Chatbot Arena. O modelo, denominado "grok-3preview-02-24", demonstrou desempenho superior em várias áreas-chave. O Grok-3-Preview-02-24 da xAI superou o GPT4.5-Preview por uma pequena margem de 1 ponto. O Grok-3 recebeu mais de 3.000 votos e, no geral,

Mar 4, 2025

ByteDance lança AIBrix: novo sistema de inferência de código aberto projetado para modelos de linguagem grandes

Feb 28, 2025

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral