Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Cerebras lança serviço de inferência de IA 'mais rápido do mundo', desafiando a liderança da Nvidia

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Aug 28, 2024

183

A Cerebras Systems Inc., uma startup de computação de inteligência artificial, lançou oficialmente o que chama de "o serviço de inferência de IA mais rápido do mundo", um desafio direto à gigante do setor, Nvidia Corp. Andrew Feldman, CEO da Cerebras, afirma que o novo serviço visa concluir tarefas de inferência de IA com maior velocidade e menor custo, respondendo à crescente demanda do mercado por soluções de inferência eficientes.

Chip

O serviço de "inferência de alta velocidade" da Cerebras é baseado em seu poderoso processador WSE-3. Este processador possui mais de 900.000 núcleos de computação e 44 GB de memória embarcada, com um número de núcleos 52 vezes maior do que uma única unidade de processamento gráfico Nvidia H100. A Cerebras afirma que seu serviço de inferência pode atingir a velocidade de 1.000 tokens por segundo, 20 vezes mais rápido do que serviços em nuvem semelhantes que usam as GPUs mais poderosas da Nvidia. Ainda mais impressionante é que o preço inicial do serviço é de apenas US$ 0,10 por milhão de tokens, alegadamente 100 vezes mais econômico do que as cargas de trabalho de inferência de IA existentes.

O serviço de inferência da Cerebras oferece três níveis de acesso: gratuito, para desenvolvedores e empresarial. O nível para desenvolvedores, acessível por meio de endpoints de API, oferece um preço de US$ 0,10 por milhão de tokens para o modelo Llama3.18B e US$ 0,60 para o modelo Llama3.170B. O nível empresarial oferece mais opções de personalização e suporte especializado, ideal para cargas de trabalho contínuas.

Várias instituições de renome já se tornaram clientes iniciais da Cerebras, incluindo GlaxoSmithKline, Perplexity AI Inc. e Meter Inc. O Dr. Andrew Ng, fundador da DeepLearning AI Inc., elogiou a capacidade de inferência rápida da Cerebras, considerando-a particularmente útil para fluxos de trabalho de IA de agente que exigem prompts repetidos em grandes modelos de linguagem.

Além do serviço de inferência, a Cerebras também anunciou várias parcerias estratégicas para fornecer aos clientes um conjunto completo de ferramentas de desenvolvimento de IA. Os parceiros incluem LangChain, LlamaIndex, Docker Inc., Weights & Biases Inc. e AgentOps Inc. Além disso, a API de inferência da Cerebras é totalmente compatível com a API de conclusão de bate-papo da OpenAI, o que significa que aplicativos existentes podem ser facilmente migrados para sua plataforma.

Inferência de Inteligência Artificial Cerebras Systems Processador WSE-3 Nvidia

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily